MONICA ALBU 


Ca 


e 


Iar 


i util 


Ica § 


Constru 


PREFATA 


Rolul important al matematicii în toate domeniile vieţii şi ale ştiinţei a 
fost recunoscut de foarte multă vreme. Leonardo da Vinci susţinea că "nu există 
nici o certitudine în ştiinţele în care nu este posibilă aplicarea vreuneia din 
ştiinţele matematice", iar A. Einstein afirma că "matematica le oferă ştiinţelor 
naturii o doză de siguranţă, pe care acestea nu ar putea să o obţină altfel”. 

Statistica, la rândul ei, are o aplicabilitate generală în domeniul 
ştiinţific. "În toate cercetările ştiinţifice de bază, statisticienii sunt cei care 
elaborează planurile de experienţă sau de observaţii şi tot la ei se recurge pentru 
a analiza rezultatele, pentru a evalua constatările şi pentru a separa faptele clar 
demonstrate de cele care mai cer confirmarea", observa Ronald Fischer. 

La fel ca şi celelalte discipline ştiinţifice, psihologia foloseşte modele 

matematice şi statistice la explorarea relaţiilor dintre variabile şi la testarea 
ipotezelor. Dar, datorită complexităţii şi ambiguitatii unor aspecte ale 
comportamentului uman, cu ajutorul procedeelor de calcul obişnuite este dificilă 
realizarea unor inferente valide şi precise. Din acest motiv, au fost create modele 
noi, specifice ştiinţelor sociale, cum sunt teoria răspunsului la itemi, folosită la 
construirea testelor psihologice, şi teoria variabilelor latente (care cuprinde 
analiza factorială şi modelele cu ecuaţii structurale), utilă pentru studierea 
relaţiilor dintre variabilele măsurate prin testele psihologice. 
Lucrarea de faţă are ca principal obiectiv familiarizarea cititorului cu 
metodele matematice şi statistice care se folosesc la construirea testelor 
psihologice şi la interpretarea scorurilor testelor. Alături de procedeele de calcul 
uzuale sunt. prezentate metode noi, bazate pe teoria aproximării şi pe teoria 
clasificării. Acestea îmbină ideile teoriei clasice a testelor cu cele ale teoriei 
răspunsului la itemi. 

Căutându-se răspuns la întrebarea "Ce înseamnă un.test bun?" s-a 
realizat o sinteză a ideilor cuprinse în lucrări clasice şi moderne din domeniul 
teoriei testelor psihologice. Este propus şi un punct de vedere nou asupra teoriei 
testelor, bazat pe teoria clasificării: testul psihologic este privit ca un instrument 
de ierarhizare şi de clasare a subiecţilor, iar construirea unui test psihologic este 
asimilată operaţiei de. creare a unui clasament prin agregarea clasamentelor 
produse de itemi. 


Lucrarea oferă, in plus, informaţii despre condiţiile de utilizare a testelor 
psihologice. Sunt discutate aspecte privind cine, când şi cum poate folosi un test 
“psihologic. | 

Două anexe contin definițiile noţiunilor matematice Şi statistice care 
intervin în metodele de calcul prezentate. Ele sunt însoţite de exemple. 

Toţi algoritmii proprii propuşi au fost verificaţi pe loturi de subiecţi. La 
administrarea testelor în acest scop şi la interpretarea, sub aspect psihologic, a 
rezultatelor obţinute am primit ajutor din partea domnului prof. dr. Horia 
Pitariu. | ţi ai 

Cartea se adresează în primul rând studenţilor de la facultăţile de 
psihologie, dar ea le poate fi utilă şi psihologilor care, în activitatea lor curentă, 
fac uz de teste psihologice. 
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CAPITOLUL 1 i 
TEST ŞI TESTARE PSIHOLOGICĂ 


1.1. CE ESTE UN TEST PSIHOLOGIC ? 


Testul este un instrument al metodei experimentale, folosit cu precădere 
în investigaţiile cu caracter aplicativ ale psihologiei (testul psihologic), 
pedagogiei (testul pedagogic, testul şcolar), sociologiei (testul sociometric) şi 
biologiei (testul fiziologic). 

Testul psihologic reprezintă, alături de observaţii, interviuri, scale de 
evaluare, tehnici proiective etc., o sursă de informare utilizată pentru evaluarea 
comportamentului uman şi a proceselor mintale. 

În privinţa definiţiei testului psihologic, nu s-a ajuns la un consens, 
fiecare autor oprindu-se asupra altor aspecte sau reţinând alte caracteristici. De 
exemplu: 

e Testul psihologic este o măsurătoare obiectivă Şi standardizată a unui 
eşantion de comportamente (Anastasi, 1976). 

e Testul psihologic este o situaţie standardizată care generează un 
comportament semnificativ (Klausnitzer, 1992). 

e Testul psihologic constă dintr-o probă, mai frecvent dintr-o serie de 
probe, construite în scopul stabilirii prezenţei (sau a absenței) unui aspect psihic, 
a particularitatilor de comportare sau a gradului de dezvoltare psihică (Roşca, 
1972). 

e Testul psihologic este o probă, utilizată mai ales in psihologia 
diferențială, care permite descrierea comportamentului unui subiect într-o 
situație definită precis ("instrucțiunile" testului), prin raportare la 
comportamentul unei grupe de subiecți fixată, plasată în aceeaşi situație. 
Această descriere se face de obicei sub formă numerică (Grand dictionnaire de 
la psychologie, 1994). 

e Un test psihologic este o procedură standardizată prin care se 
formează un eşantion de comportamente care va fi descris prin Categorii sau 
scoruri. În plus, multe teste au norme sau standarde care fac posibilă utilizarea 
rezultatelor la predicția altor comportamente, mai importante (Gregory, 1992). 

e Un test psihologic este definit prin următoarele caracteristici: 
materiale şi proceduri standardizate; motivaţie optimă; înregistrare imediată; 
cotare obiectivă; norme potrivite şi validitate verificată (Dahlstrom, 1993). 

„Fără a încerca să formulăm o definiţie, vom prezenta elementele pe care 
le considerăm esenţiale pentru înţelegerea noţiunii de "test psihologic”. 
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„A, Testele psihologice servesc fie la măsurarea unor atribute psihice 
(ca, de exemplu, atenţia), fie la predicția unor comportamente (ca, de pildă, 
succesul profesional). 

B. Un test psihologic constă din una sau mai multe probe. Fiecare probă 
determină o reacţie comportamentală a subiectului (cum ar fi, de pildă, 
reproducerea unui şir de numere) sau îi cere acestuia să facă aprecieri asupra 
unui comportament al său (de exemplu, să indice frecvenţa întârzierilor la 
serviciu ori intensitatea efortului depus pentru îndeplinirea la timp a sarcinilor 
de serviciu). Răspunsurile sunt evaluate, conform unor reguli fixate, obţinându- 
se una sau mai multe valori numerice, denumite scoruri. 

“Un element al testului psihologic constituit dintr-o situaţie stimul care 
solicită un răspuns ce poate fi evaluat separat de restul testului se numeşte item. 
Un item poate consta, de exemplu, dintr-o întrebare însoţită de mai multe 
răspunsuri posibile, dintr-un desen care trebuie completat sau dintr-o listă de 
termeni care trebuie ordonati după un criteriu specificat. Răspunsului dat de 
subiect la un item i se atribuie un scor. o 

Un set de itemi care se referă la acelaşi aspect (un atribut psihic pe care 
testul îl măsoară sau un comportament pe care testul îl prezice) formează o 
scală. Pentru fiecare scală se calculează un scor, pe baza scorurilor itemilor 
componenți, conform unei reguli stabilite de autorul testului. De exemplu, 
scorul unei scale dintr-un test de cunoştinţe poate fi egal cu suma scorurilor - 
itemilor rezolvati corect sau cu scorul celui mai dificil item rezolvat corect sau 
cu scorul celui mai uşor item rezolvat greşit. 

Nu există restricţii privind numărul de itemi care formează o scală sau 
numărul de scale care intră în componenţa unui test psihologic. Multe chestio- 
nare de personalitate cuprind zeci de scale, fiecare conţinând mai multi itemi. 
În schimb, alte teste (cum este, de pildă, Testul de capacităţi organizatorice al 
lui A. Huth) sunt alcătuite dintr-o singură scală, cu un singur item. l 

C. Pentru a nu necesita un timp de administrare prea lung, nici un test 
psihologic nu evaluează toate comportamentele care ar putea fi utilizate la 
definirea sau la măsurarea unui anumit atribut, ci doar un eșantion de 
comportamente din această mulțime, ales astfel încât să fie reprezentativ pentru 
toate comportamentele mulțimii respective care ar putea fi observate în afara 
situației de testare. 

De exemplu, dacă s-ar dori să se evalueze deprinderea copiilor din clasa 
întâi de a face calcule aritmetice, procedeul corect de lucru ar fi să se 
urmărească toate calculele efectuate de fiecare subiect: la şcoală, la rezolvarea 
temelor, la joacă, la cumpărături etc. Evident, acest lucru este imposibil. S-ar 
putea, însă, construi un test alegând exerciții care să solicite efectuarea 
operaţiilor aritmetice cu numere formate din una sau două cifre. Pentru ca 
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eşantionul să fie reprezentativ, exerciţiile cuprinse în test trebuie să contina toate 
cele patru operaţii aritmetice. | 

Nu este necesar ca itemii unui test construit în scopul predictiei unui 
comportament să descrie exact comportamentul respectiv. De altfel, ar fi 
imposibil ca un test utilizat la selecţia profesională, deci înainte de ocuparea 
unui loc de muncă sau a unui loc la un curs de instruire pentru o anumită 
profesie, să se refere la comportamentele care sunt specifice profesiei respective. 
De exemplu, nu li se poate cere persoanelor care se prezintă la selecţia pentru 
şcoala de şoferi să conducă o maşină pe şosea. Testul psihologic măsoară 
comportamente prin care se pot face inferenje asupra altor comportamente. 

D. În etapa de construcţie a testului psihologic se stabilesc şi regulile 
care trebuiesc respectate la utilizarea acestuia, pentru a se asigura o funcţionare 
corectă a testului ca instrument de măsură. Aceste reguli, care sunt prezentate 
în manualul testului, se referă la: 

A. e conţinutul testului (care sunt stimulii prezentaţi pentru a provoca 
reacţiile comportamentale evaluate de test); 

® e condiţiile de administrare (instrucţiunile date subiectului în legătură 
cu sarcina ce trebuie executată); 

C e tehnica de evaluare a răspunsurilor (modul de cotare a reacţiilor, 
cotare care să nu permită decât o intervenţie redusă a subiectivităţii . 
examinatorului şi, în consecinţă, să realizeze un acord cât mai mare între 
examinatori); 

ly e modul de interpretare a rezultatelor obţinute de un subiect. 

O probă sau o serie de probe formează un test psihologic numai dacă 
este însoţită de regulile de utilizare, adică dacă este standardizată. 

Vom explica în continuare importanţa respectării regulilor de utilizare 
a testului. 
e Majoritatea testelor au o structură fixă: tuturor subiecţilor li se 
administrează aceiaşi itemi, în aceeaşi ordine. Dacă testul conţine atât itemi 
uşori cât şi dificili, iar ordinea itemilor nu ar fi fixă, atunci comportarea la test 
a subiecţilor ar putea fi influenţată de poziţia itemilor dificili: prezenţa acestora 
la început poate fi obositoare şi chiar descurajatoare, repercutându-se negativ 
asupra modului de răspuns la ceilalţi itemi. 

„Există şi teste al căror conţinut se stabileşte în timpul administrării lor, 
în funcţie de răspunsurile date de subiect. 

b) e Condiţiile de administrare a testului afectează comportamentul celor 
testaţi. O persoană are şanse mai mici să răspundă corect la itemii unui test de 
atenţie atunci când acesta este administrat într-o încăpere de trecere, decât dacă 
testarea se face într-o cameră liniştită. 
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| În majoritatea cazurilor modul în care este administrat testul depinde şi 
de competenţa examinatorului (de gradul de informare al acestuia relativ la test, 
de experienţa pe care o are în administrarea testelor, de grija pe care o manifestă 
faţă de examinaţi). i di 
| Dacă testul este administrat colectiv şi sunt urmate întocmai instruc- 
tiunile din manualul testului, li se poate asigura tuturor subiecţilor o similaritate 
a condiţiilor de testare, În schimb, la testarea individuală personalitatea exami- 
natorului are un rol mult mai important, fiind posibil ca aceeaşi persoană, cu 
ocazia a două testări efectuate de examinatori diferiţi, să aibă comportamente 
total diferite. | Meas | eke 
e) e Cele mai multe teste psihologice au reguli fixe pentru calculul 
scorurilor, formulate astfel încât scorurile obţinute de subiecţi să nu depindă de 
persoana care le calculează. În această categorie intră, de exemplu, testele cu 
alegere multiplă, întrucât pentru ele este stabilit, încă din faza de construcţie a 
lor, punctajul care se acordă fiecărui răspuns propus, la fiecare item. -Există şi 
teste pentru care scorul reflectă aprecierea subiectivă a celui care îl calculează. 
Un exemplu îl constituie testele de creativitate care cer să se indice cât mai 
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multe posibilități de utilizare pentru un anumit obiect, iar punctajul acordat 


Interpretarea unui scor individual se poate face numai prin compararea 
sa, fie cu rezultatele obținute de alte persoane care fac parte din aceeaşi 
populaţie ca şi subiectul, fie cu anumite praguri, indicate de autorul testului, 
care delimitează mai multe categorii. De exemplu, în cazul testelor de cunoştinţe 
utilizate la concursurile de admitere, care furnizează un punctaj cuprins între 1 
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şi 10, se fixează un singur prag, de obicei egal cu 5, iar subiectul este considerat 
"admis" dacă scorul său este mai mare decât pragul, şi "respins", în caz contrar. 

U baza scorurilor obţinute la scalele un nui test, se identifică o 
categorie în care este potrivit să fie repartizată persoana examinată. Categoria 
poate reprezenta un tip de temperament, o boală psihică, un program de 
pregătire profesională etc. 

Modul de interpretare a rezultatelor este stabilit de autorul testului şi 
este prezentat în manualul testului. 

E. Se spune că un test este obiectiv dacă el permite să se măsoare fără 
ambiguitate capacităţile unei persoane (Klausnitzer, 1992). Pentru a fi obiectiv, 
testul trebuie să îndeplinească trei condiţii: 

e Rezultatele să nu fie dependente de nivelul de pregătire al subiectului 
în domeniul testării psihologice, adică persoana examinată să nu poată ghici 
cum se interpretează răspunsurile la itemi şi, prin urmare, să nu poată denatura 
rezultatele (să nu poată da acele răspunsuri care generează despre sine impresia 
pe care o doreşte). 

o Fiecare răspuns posibil la un item să fie interpretat la fel (ca fiind 
corect sau greşit, favorabil sau nefavorabil pentru aspectul măsurat etc.) de mai 
mulţi experţi care analizează testul. De exemplu, la itemul "Mă simt bine într-o 
societate veselă" mai multi psihologi să fie de acord că răspunsul "Adevărat" 
corespunde persoanelor extravertite, iar răspunsul "Fals" celor introvertite. 

e Scorul obţinut de subiect să nu fie influenţat de personalitatea 
examinatorului, adică testul să fie cu cotare obiectivă. Această condiţie nu este 
îndeplinită de multe teste, în special de cele proiective şi de testele de cunoştinţe 
ai căror itemi sunt cu răspunsuri deschise. 

F. O trăsătură comună tuturor testelor psihologice este precizia lor 
limitată. Sunt extrem de rare cazurile când un test furnizează o măsură exactă 
a unei variabile care are efecte importante asupra comportamentului uman. Din 
acest motiv, nici deciziile care se iau pe baza lor nu sunt totdeauna corecte. De 
exemplu, unii psihologi susțin că, din cauza lipsei de consistență a 
comportamentului de la o situaţie la alta, coeficienţii de corelaţie liniară dintre 
scorurile unui test de personalitate şi un comportament pe care acesta îl prezice 
nu depăşesc valoarea de 0.3 sau 0.4 (W. Mischel şi R. E. Nisbett, după Funder, 
1983). Dar, nu există alte metode de măsurare, mai precise. Prin urmare, testele 
psihologice reprezintă cea mai bună, cea mai i corectă şi cea mai precisă 
tehnologie disponibilă pentru a lua decizii i importante asupra aves 
(Murphy, Davidshofer, 1991). di 
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1.2. UTILIZĂRI ALE TESTELOR PSIHOLOGICE 


Testele psihologice sunt folosite, in principal, pentru a stabili un 
diagnostic psihologic, prin evaluarea comportamentului, a abilităţilor mintale _ 
şi a altor caracteristici de personalitate, pentru a face aprecieri și predicții 
referitoare la subiecţi şi pentru a lua decizii asupra persoanelor. În general, 
testele predictive şi cele pentru decizie se utilizează în selecţia profesională, iar 
cele diagnostice servesc la măsurarea unor caracteristici psihice, fie pentru 
aprecierea efectelor unui program de instruire, fie pentru cunoaşterea individului 
de către psihologul clinician. 

Predictia se referă la estimarea performanţei viitoare a individului, de 
exemplu la un anumit loc de muncă. 

Într-un sens restrâns, însă, chiar şi diagnosticul situaţiei prezente, de 
pildă al retardării mintale sau al dezechilibrului emotional, implică o predictie 
asupra a ceea ce va face individul în situaţii diferite de cea actuală. Din acest 
motiv, se poate afirma că toate testele psihologice sunt esantioane de 
comportament pe baza cărora se pot face predicții guni a altor comportamente 
(Anastasi, 1976). 

Pe de altă parte, luarea unei decizii corecte se Beeta de obicei pe 
efectuarea unei prognoze asupra consecințelor deciziei. De exemplu, într-o 
selecție de personal decizia de încadrare pe un post se ia în urma comparării 
„performanţelor trecute şi actuale ale indivizilor cu un set de condiţii, considerate 
a fi absolut necesare pentru îndeplinirea muncii respective. Scopul deciziei este 
de a identifica acele persoane care vor realiza cele mai bune performanțe pe 
postul pe care vor fi încadrate. Variabilele care servesc ca bază pentru decizie 
şi asupra cărora sunt fixate condiţiile eliminatorii trebuie să aibă valoare 
predictivă. | 

În funcţie de scopul urmărit prin administrarea testelor, se pot distinge 
următoarele categorii de utilizări ale acestora (Gregor y, 1992): 


A. Clasificarea persoanelor 

Pe baza rezultatelor obtinute la test se orice. în care clasă, din mai 
multe existente, să fie repartizat fiecare subiect. In acest mod se peg 
atunci când: 

e se alege cel mai potrivit program de pregătire EER sau profesio- 
nală, în funcție de particularitatile psihice şi de cunoştinţele persoanelor; 

@ la sfârşitul unui program de instruire sau cu ocazia examinării pentru 
admiterea la o formă de învăţământ, se decide dacă un candidat poate fi declarat 

"reuşit" sau "nereusit"; 
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e se identifica persoanele care au caracteristici speciale (de exemplu 
sunt capabile de performante superioare intr-un anumit domeniu), folosind un 
test de selecţie simplu, care se administrează rapid (screening, test); pentru 
persoanele care au realizat scoruri mai mari decât un prag fixat se vor administra 
apoi alte teste, care realizează măsurători mai precise. 


B. Diagnoză psihologică şi alegerea tratamentului 

Diagnoza urmăreşte să determine natura, cauza şi intensitatea 
comportamentului anormal al persoanei şi să identifice categoria de boală în 
care este cel mai potrivit să fie încadrat subiectul (diagnosticul). Pe baza 
informaţiilor furnizate de diagnoză se instituie tratamentul pentru remedierea 
deficienţelor sau pentru îmbunătăţirea performanţelor. 

Adesea, testele de personalitate servesc la diagnoza tulburărilor 
emoţionale. 


C. Autocunoaştere 
d Comparând rezultatele obţinute la testele psihologice cu cele ale altor 
persoane, subiectul se poate cunoaşte mai bine. 


D. Evaluarea eficienţei unui program educaţional sau social 
| O modalitate de evaluare a eficienţei constă în compararea rezultatelor 
obţinute la teste psihologice de subiecţii care au fost supuşi influenţei progra- 
mului, fie cu rezultatele unor persoane care nu au fost incluse în programul 
respectiv, fie cu scorurile aceloraşi persoane, înainte de acţiunea programului. 


E. Cercetări teoretice sau aplicative asupra comportamentului uman 

Se folosesc diverse teste psihologice pentru a depista cauza unor | 
comportamente sau condiţiile - de natură psihică - în care un anumit tratament 
(de exemplu, o metodă de psihoterapie sau un program de instruire) are şanse 
de succes. | 
| Construirea unui test psihologic impune efectuarea unei cercetări în care 
se folosesc şi teste psihologice cunoscute. Un acelaşi test psihologic poate fi 
utilizat în scopuri diferite. De exemplu, un test care permite formularea unui 
diagnostic psihiatric poate servi şi la autocunoaştere. 


1.3. CONDITII DE UTILIZARE A TESTELOR PSIHOLOGICE 


În mai multe țări au fost elaborate norme etice şi standarde de utilizare 
a testelor psihologice şi de practicare a examinărilor psihologice. 

Standardele citate mai frecvent în literatura de specialitate şi la care vom 
face referire în această lucrare sunt cele elaborate: în S.U.A., în 1985, de 
reprezentanți a trei organizaţii profesionale: The American Educational 
Research Association, The American Psychological Association (APA) şi The 
National Council on Measurement in Education. Intitulate Standards for 
Educational and Psychological Testing, ele descriu amănunţit condiţiile care 
trebuiesc îndeplinite la construirea, evaluarea, administrarea $i interpretarea 
testelor psihologice. Sunt vizate două aspecte, şi anume: 

e caracteristicile psihometrice ale testelor; 

e comportamentul profesional al psihologilor, insistându-se asupra ideii 
că ei poartă responsabilitatea pentru apărarea bunăstării persoanelor testate. 

Aceste Standarde au fost completate cu prevederi specifice unor 
domenii particulare. Aşa sunt, de exemplu: 

e Specialy Guidelines (APA, 1981), cu îndrumări pentru psihologii care 
lucrează în clinică, în organizaţii industriale, în şcoli sau în activitatea de. 
consiliere; > S 

e Principles for the Validation and Use of Personnel Selection 

* Procedures (Society for Industrial and Organizational Psychology, 1987), 
privind conditiile de desfasurare a selectiei profesionale; 

® Guidelines for Computer-Based Tests and Interpretations (APA,. 
1986), referitoare la folosirea calculatorului în testarea psihologică. ` 

In ceea ce priveşte principiile etice care trebuie să îi călăuzească pe 
psihologi în activitatea de evaluare, în completarea celor cuprinse în Standards 
for Educational and Psychological Testing vin cele enunțate în Ethical 
Principles of Psychologists and Code of Conduct (APA, 1992). Redăm câteva 
dintre ideile enunțate aici: i | 
| e evaluarea psihologică si psihodiagnosticul trebuie să se facă numai 
într-un cadru profesional, de către utilizatori de teste competenţi şi cu experienţă 
în domeniu, cu ajutorul unor teste potrivite; | 

e pentru proiectarea şi selectarea tehnicilor adecvate populațiilor 
particulare se vor folosi proceduri ştiinţifice; | i 

| e interpretarea rezultatelor şi explicarea acestora se vor face cu mare 
atentie; | | 
e se va acționa pentru păstrarea securității testelor. 
In proiectul Statutului psihologului din România, propus de biroul 
Asociației Psihologilor din România, se precizează că profesia de psiholog "se 
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exercită numai de către psihologi” (art. 1). Această profesie constă “în 
observarea, evaluarea, explicarea, predicția şi modificarea comportamentului _ 
uman prin aplicarea principiilor, metodelor şi procedurilor ştiinţifice în scopul 
prevenirii şi tratamentului tulburărilor psihice şi de comportament, precum şi în 
scopul dezvoltării relaţiilor interpersonale, adaptării eficiente la viaţă şi muncă, 
optimizării ergonomice a producţiei, creşterii eficienţei personale şi menţinerii 
sănătăţii psihice şi fizice (art. 2). 

Vom prezenta în continuare câteva aspecte care sunt deosebit de 
importante atunci cand se utilizează teste psihologice (Anastasi,1976; Gregory, 
1992; Murphy, Davidshofer, 1991). 


A. Calificarea examinatorului 

Testarea psihologică efectuată de nespecialişti este extrem de dăunătoa- 
re, atât pentru subiect, cât şi pentru cel care a solicitat examinarea (organizatorul 
unui program de instruire care trebuie să trieze candidaţii, compania care doreşte 
să angajeze personal etc.), întrucât există riscuri mari să se ajungă la concluzii 
false. Din acest motiv, La Comission Internationale de Reglementation de la 
Production et de la Vente des Tests, la Congresul Asociaţiei Internaţionale de 
Psihologie Aplicată, în 1971, a decis să reglementeze distribuirea testelor 
psihologice astfel: 

e autorilor li se cere să limiteze distribuirea testelor la persoanele care, 
prin formaţia lor şi prin respectul manifestat fata de metodologia şi deontologia 
profesiei lor, sunt capabile să le folosească; 

e editorilor |i se cere să controleze distribuirea testelor, vânzându-le 
direct numai utilizatorilor calificaţi profesional; 

e utilizatorilor li se cere să aplice testele numai conform indicatiilor 
date de autorii acestora. Ei trebuie să respecte drepturile de autor, să nu 
reproducă, traducă, adapteze sau modifice un test fără permisiunea autorului şi 
a editorului. Persoanele a căror formaţie profesională este incompletă nu pot 
cumpăra şi utiliza teste decât prin intermediul şi sub supravegherea unei 
persoane care are calificarea necesară. 

Aceste hotârâri sunt respectate de toate marile firme care produc, 
distribuie sau utilizează teste psihologice. De exemplu, Etablissement 
d'Applications Psychotechniques (EAP), o instituţie franceză care echipează cu 
teste psihologice cele mai mari centre de examinare psihologică din Franţa 
(SNCF, Citroen etc.) şi din lume (România, Polonia, Belgia, Olanda etc.) obligă 
persoanele care doresc să cumpere teste psihologice să prezinte o fotocopie a 
diplomei de licenţă în psihologie. 

Numeroase state au acceptat ca dreptul de profesare a psihologiei să fie 
acordat numai pe baza unor standarde de competenţă, cum sunt titlul de doctor 
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in psihologie, diploma de master in psihologie sau diploma de absolvire a unui 
curs de specializare intr-un domeniu al psihologiei. Diploma de absolvire a 
facultatii de psihologie este adesea insuficientă. 

_ Deexemplu, Guidelines for Computer-Based Tests and Interpretations 
(APA, 1986) apreciază că au dreptul de utilizare a testelor psihologice doar 
"profesionistii calificaţi” care, în plus, îndeplinesc şi următoarele condiţii (după: 
Eyde, Kowal, 1987): 

e au cunoştinţe asupra măsurării psihologice; 

e cunosc istoricul testelor sau al chestionarelor pe care le utilizează; 

e au experienţă în utilizarea testelor, astfel încât pot aprecia când există 
diferenţe de sex, vârstă sau cultură între rezultatele la un test; 

e au cunoştinţe în domeniul în care aplică testele. 

De exemplu, în cazul chestionarelor de personalitate, utilizatorul trebuie să aibă 
cunoştinţe de psihopatologie şi de teoria personalităţii. 

Cataloagele care prezintă teste psihologice specifică şi nivelul de 
competenţă necesar cumpărării şi utilizării fiecărui test. În multe tari, studenţii 
pot achiziţiona teste psihologice, doar dacă le prezintă distribuitorilor de teste 
semnătura persoanei responsabile de activitatea lor. 
B. Calitatea instrumentelor şi a procedurilor de măsurare 

` Înainte de a utiliza un test, psihologul are obligaţia de a citi manualul 
testului, pentru a afla dacă: . 

e testul este adecvat scopului urmărit (de exemplu, dacă măsoară 
trăsătura care prezintă interes); 

_@ testul este potrivit caracteristicilor subiectului /subiectilor (sex, vârstă, 
nivel de studii etc.); 
| e calităţile testului (validitate, fidelitate, dificultate etc.) sunt 
| acceptabile. 

Este important de reţinut că felul în care acţionează un test depinde nu 
numai de calităţile sale, constatate în diverse experimente, ci şi de scopul pentru 
care este folosit şi de celelalte procedee de examinare psihologică utilizate 
împreună cu el. De exemplu, s-a constatat că, în cazul selecţiei profesionale, 
subiecţii au mai multă încredere în informaţiile furnizate de testele de aptitudini 
decât în cele obţinute din chestionarele de personalitate, ceea ce influențează 
. negativ sinceritatea răspunsurilor la itemii chestionarelor. S-a observat, de 
asemenea, că asocierea chestionarelor de personalitate cu teste de aptitudini şi - 
cu un interviu creează o atitudine mai favorabilă faţă de examenul psihologic 
decât atunci când chestionarele de personalitate sunt însoțite doar de interviu 
' (Fletcher, 1997). 
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Testarea psihologică necesită pregătiri pentru asigurarea calităţii bune 
a materialelor utilizate şi a condiţiilor de examinare. 

Un test redactat neîngrijit, cu greşeli de ortografie, pătat sau cu figuri 
desenate neglijent le va face o impresie proastă subiecţilor, scăzându-le interesul 
pentru completarea sa ori, uneori, derutându-i. Performanţele la test vor fi, 
astfel, afectate. 

Examenele psihologice improvizate în săli lipsite de mese, gălăgioase 
sau cu o luminozitate improprie vor conduce, de asemenea, la distorsionarea 
rezultatelor. 

Este indicat ca examenul psihologic să fie anunţat din timp şi să se 
specifice cum trebuie să se pregătească subiecţii: să nu se prezinte la examen 
obosiţi, să nu consume alcool înaintea examinării, dacă folosesc ochelari, să îi 
aibă asupra lor etc. 


C. Obţinerea consim{amAntului subiectului pentru examinarea psihologică 

Psihologul are obligaţia să îi explice subiectului motivul examenului 
psihologic şi să obţină acordul acestuia de a se supune la test. Între persoana 
testată şi examinator se va încheia o convenţie scrisă, semnată de ambele 
persoane, prin care subiectul declară că a primit explicaţii ample despre scopul 
examinării, despre testele care vor fi utilizate şi despre modul în care vor fi 
folosite rezultatele, îşi dă consimţământul să fie examinat psihologic şi indică 
persoanele cărora le pot fi comunicate rezultatele examinării. 

Dar, obţinerea consimţământului unei persoane pentru a participa la o 
examinare psihologică poate denatura rezultatele testelor, întrucât, cunoscând 
ceea ce se intenţionează să se măsoare, subiectul poate răspunde nesincer, din 
dorinţa de a crea o anumită imagine despre sine. Psihologul este pus uneori în 
situaţia de a opta între a obţine date corecte despre indivizii testati şi a respecta 
dreptul celor examinati de a fi informaţi despre test. In general, atunci când in- 
truziunea testului în viata particulară este minoră şi se asigură confidentialitatea 
răspunsurilor nu li se mai dau subiecţilor informaţii detaliate despre test. 


D. Confidenţialitatea rezultatelor 

Cu excepţia cazului când persoana examinată reprezintă un pericol 
pentru sine sau pentru alţii, informaţia furnizată de testele psihologice este 
confidențială şi nu va fi comunicată altora fără consimţământul subiectului. 
Chiar şi atunci când subiectul este de acord ca rezultatele sale să fie cunoscute 
şi de alţii, rezultatele vor fi arătate doar medicului, avocatului sau psihologului 
care se ocupă de persoana respectivă. 

Acceptând ideea că scorurile realizate la un test pot fi afectate de erori, 
uneori mari, care pot cauza interpretări neconforme cu realitatea, cu ocazia 
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comunicării rezultatelor trebuie să i se dea posibilitate subiectului să corecteze - 
ceea ce el consideră că este o impresie nefavorabilă despre sine (Fletcher, 1997). 
Din acest motiv, în unele tari, cum este Olanda, codul etic pentru psihologi 
prevede ca rezultatele testării să fie comunicate mai întâi subiectului. 

În mod obişnuit trebuie evitată afişarea rezultatelor examenului 
psihologic. De exemplu, în cazul selecţiei profesionale se recomandă să se 
afişeze doar numele persoanelor declarate admise, fără alte date care ar putea 
constitui o violare a intimităţii subiecţilor. Cei nereuşiţi nici nu trebuie amintiţi. 
Acest lucru se impune mai ales atunci când sunt utilizate teste de inteligenţă sau 
de personalitate, întrucât denumirile acestora pot sugera interpretări care să îi 
lezeze pe subiecţii cu scoruri foarte mici (sau foarte mari, în funcţie de test). 


E. Comunicarea rezultatelor testarii 

Niciodată rezultatele unui examen psihologic nu sunt Rezi sub 
“forma lor brută, ci doar prelucrate şi interpretate. Obişnuit, ele sunt prezentate 
în cadrul unui raport psihologic, întocmit în conformitate cu solicitarea 
beneficiarului. Acest raport va fi redactat clar, fără ambiguitati. Se va evita 
utilizarea termenilor tehnici, dificili de înţeles de nespecialişti. De asemenea, nu 
se va face presupunerea că beneficiarul cunoaşte testul şi îi sunt suficiente doar 
informaţii sumare. De exemplu, unui nespecialist trebuie să i se explice ce 
înseamnă faptul că o persoană a obţinut un coeficient de inteligenţă de 87 şi ce 
implicaţii ar putea avea aceasta. Datele comunicate trebuie să reflecte obiectiv 
situaţia, evitându-se observaţiile subiective şi părerile personale. 

O deficiență a multor rapoarte psihologice constă în faptul că ele descriu 
comportamente (de exemplu,. "în timpul discuţiilor, subiectul gesticulează 
continuu"), fără a oferi comentarii asupra lor. Aceasta se întâmplă, de obicei, 
atunci când nici psihologul nu a putut interpreta faptele sau a considerat că 
explicaţiile nu prezintă interes pentru cel care citeşte raportul. Dar, simpla 
enumerare a observaţiilor făcute, fără comentarii, poate genera o mare varietate _ 
de interpretări şi poate conduce la formarea unei imagini greşite asupra 
subiectului. Este preferabil ca în raport să fie incluse toate explicaţiile pe care. 
psihologul le consideră posibile, atrăgându-se atenţia că ele nu sunt certe. l 

Uneori, rezultatele obținute la teste de o persoană sunt contradictorii. 
De exemplu, subiectul poate să apară la un test ca introvertit, jar la altul, ca 
sociabil. În asemenea situații este important ca psihologul să prezinte toate 
constatările făcute si să încerce să găsească explicaţii. 


F. Efectul discriminatoriu al testului asupra grupurilor minoritare 


Aici termenul de "grup minoritar” este legat de contextul în care se 
aplică testul şi defineşte un grup, format în funcţie de o anumită variabilă (sex, 
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statut social, nivel socio-cultural, apartenenţă etnică etc.), care conţine mult mai 
puţine persoane decât celelalte grupe. De exemplu, la selectiile profesionale 
pentru postul de secretară, faptul că numărul bărbaţilor care se prezintă este, de 
obicei, mult mai scăzut decât cel al femeilor, face ca bărbaţii să constituie un 
grup minoritar. 

Problema discriminării produse de utilizarea unui test se pune mai ales 
atunci când testul respectiv este folosit în cadrul selecţiei profesionale şi se 
utilizează un singur prag de admisibilitate (cutoff score), adică o singură valoare 
cu care se compară scorurile subiecţilor pentru a se decide dacă sunt admişi sau 
respinşi. Dacă există grupuri minoritare care obțin scoruri mai mici decât alte 
grupuri, persoanele care fac parte din ele vor avea şanse mai mici de a fi 
selectate. Ele se vor considera victime ale discriminării. Realitatea nu este 
totdeauna aceasta. Să analizăm două situaţii în care se prezintă la selecţie două 
grupuri, unul cu scoruri mari la test şi celălalt cu scoruri mici. 

(1) Să presupunem mai întâi că testul este construit astfel încât 
rezolvarea sa nu este influenţată de elemente care nu au nici o legătură cu 
variabila prezisă de test, numită criteriu. De exemplu, testul este utilizat la 
selecţia profesională pentru un post de casier; el se referă la deprinderea de a 
efectua rapid şi corect calcule aritmetice şi rezolvarea sa nu este dependentă de 
gradul de stăpânire a limbii. Criteriul utilizat fiind performanţa în muncă, dacă 
linia de regresie a criteriului fata de test este aceeaşi pentru ambele grupuri, 
atunci din faptul că un grup obţine scoruri mai mici la test se deduce că el va 
avea rezultate mai slabe şi în muncă, deci este normal ca persoanele din grupul 
respectiv să fie respinse la selecţie. În acest caz testul nu are efect 
discriminatoriu. 

(2) Se poate întâmpla, însă, ca cele două grupuri să fie la fel de potrivite 
pentru postul pentru care se face selecţia (performanţele lor în muncă sunt 
similare), dar liniile de regresie ale criteriului faţă de scorurile testului să difere 
de la un grup la altul. Astfel de situaţii apar atunci când persoanele dintr-un grup 
obţin rezultate slabe la test dintr-un motiv care în activitatea viitoare nu are 
importanţă sau poate fi compensat (de exemplu din cauza unui handicap de 
limbă ori cultură). Dacă se foloseşte acelaşi prag de admisibilitate pentru 
ambele grupuri, vor fi respinse unele persoane cu scoruri mici la test care ar fi 
putut obţine performanţe în muncă mai bune decât unele persoane admise. În 
asemenea cazuri se poate vorbi despre efectul discriminatoriu al testului, întrucât 
sunt defavorizati la selecţie cei din grupul cu scoruri mici la test. Pentru acest 
grup ar fi trebuit fixat un prag de admisibilitate mai scăzut. 


25 


| | CAPITOLUL 2 f | 
CÂTEVA NOŢIUNI CARE INTERVIN ÎN TEORIA | 
TESTELOR PSIHOLOGICE 


2.1. CONSTRUCTUL PSIHOLOGIC. 


Un construct este, în general, o idee "construită" de experţi dintr-un 
domeniu particular al ştiinţei, pentru a rezuma un grup de fenomene sau de 
obiecte şi pentru a fi utilizată într-un cadru ştiinţific (teoretic, metodologic sau 
aplicativ). A, ex ; 

După Murphy şi Davidshofer (1991), orice construct are doua 
proprietati: ob. 

e este o abstractizare a unor regularitati din natură; 
„e nu este observabil direct, dar poate .fi conectat cu entitati sau 

evenimente concrete, observabile. Il 

Constructele psihologice sunt evidenţiate, direct sau indirect, de 
comportament sau în urma conducerii unor experimente dedicate măsurării lor. 
„Un construct psihologic, arată J.F. Binning şi G.V. Barett (Silva, 1993), este "o 
etichetă aplicată unei grupări de comportamente care covariazi". Pentru 
Standards for Educational and Psychological Tests din 1985 , constructul este 
"o noţiune teoretică derivată din cercetare şi din alte experienţe, care a fost 
construită pentru a explica patternuri de comportament observabile". 

Constructele create pentru interpretarea rezultatelor testelor psihologice 
sunt identificate, de obicei, cu câte o clasă de răspunsuri (L. J. Cronbach, după ` 
Silva, 1993). | | i 

Unii autori consideră constructele ca fiind multidimensionale, formate 
din "componente" independente unele de altele, numite uneori "fațete", şi 
recomandă utilizarea analizei factoriale ca metodă pentru studierea acestora. De 
exemplu, în modelul elaborat de Guilford, constructul "creativitate" are drept 
componente: fluiditatea, flexibilitatea, originalitatea, elaborarea, senzitivitatea 
faţă de probleme şi redefinirea (Landau, 1979). Prezenţa componentelor ridică 
probleme în studiul relaţiei dintre construct, privit ca variabilă independentă, şi 
o variabilă dependentă prezisă de construct. O posibilitate de rezolvare este 
cotarea separată a componentelor, cumularea scorurilor şi cercetarea relaţiei 
dintre scorul total obţinut şi valorile variabilei dependente. Dar, uneori, 
componentele ar putea să prezică mai bine variabila dependentă decât 
constructul general. În asemenea situaţii se studiază separat relaţia dintre fiecare 
componentă şi variabila dependentă (Ozer, Reise, 1994). 
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Fiecare construct psihologic este fundamentat pe o teorie, care permite 
descrierea şi predicția comportamentelor legate de el, în situaţii specifice. 

Pentru elaborarea unui test care să îl măsoare, constructului i se asociază 
o variabilă cantitativă despre care se presupune că se află în relaţie crescătoare 
cu scorurile testului. Se formulează apoi o serie de afirmaţii referitoare la modul 
în care se comportă persoanele care au valori mari ale acestei variabile, 
comparativ cu cele care au valori scăzute. De exemplu, vrând să dezvolte un test 
de evaluare a motivatiei indivizilor pentru propria realizare, McClelland şi 
colaboratorii săi au formulat următoarele descrieri de comportamente 
(Thorndike, Haagen, 1961): 

e Persoanele care au o motivaţie puternică pentru realizare au rezultate 

şcolare bune. | 

e Motivația pentru realizare este mai mare dacă subiecţilor li se 

administrează în prealabil teste despre care li se spune că măsoară 

inteligenţa. 

e Cei care au o motivaţie puternică pentru realizare completează mai 

mulţi itemi într-un test de viteză a cărui funcţie le-a fost explicată. 

e Motivația pentru realizare este mai mare la copiii a căror familie le-a 

încurajat de timpuriu independenţa. 

Fiecare dintre aceste descrieri este bazată pe un fel de "teorie a 
comportamentului uman". De exemplu, realizarea şcolară este văzută ca o 
combinaţie între aptitudinea şcolară şi efort. Dintre persoanele cu acelaşi nivel 
aptitudinal, cele care au o motivaţie mai mare pentru realizare depun un efort 
mai mare şi obţin rezultate şcolare mai bune (Thorndike, Haagen, 1961). 
| = Comportamentele prin care autorul testului consideră că se manifestă 
constructul pot fi influențate de diverse variabile, precum vârsta, sexul, educaţia 
primită etc. Pentru unele dintre acestea legătura cu constructul poate corespunde 
unei situaţii reale, observată în populaţia căreia i se adresează testul şi acceptată 
de teoria care stă la baza constructului. Pentru altele, însă, ea denotă că aceste 
comportamente nu sunt caracteristice constructului. De asemenea, 
comportamentele prin care este descris constructul măsurat de test se pot asocia 
cu comportamente prin care se manifestă alte constructe psihologice, evaluate 
prin teste existente. 

În consecinţă, elaborarea unui test care să măsoare un anumit construct 
impune descrierea constructului în termeni comportamentali concreti. Operația 
se numeşte explicarea constructului şi constă din următorii trei paşi (Murphy, 
Davidshofer, 1991): : 

` (1) Se identifică acele comportamente care au legătură cu constructul 
măsurat de test. - 
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(2) Se identifică alte constructe şi pentru fiecare se decide daca are sau 

nu legătură cu constructul măsurat de test. 

(3) Pentru fiecare construct se alcătuieşte o lista de comportamente prin 

care acesta se manifestă. Pentru fiecare comportament, pe baza relaţiilor 

dintre constructe, se decide dacă are sau riu legătură cu constructul 
măsurat de test. 

Rezultă astfel un sistem de relaţii care înglobează un set de constructe 
şi comportamente, denumit de L. J. Cronbach, refea nomologică ("nomologică" 
în sensul că ea are la bază declaraţii exprimate sub formă de legi). Unii autori 
au folosit termenul de "reţea stohastică", susținând că relaţiile dintre 
componentele reţelei sunt mai degrabă probabilistice decât de tip lege. 

O descriere amănunţită a constructului trebuie să conţină şi relaţiile 
acestuia cu cât mai multe variabile fiziologice, psihologice etc. De exemplu, 
dacă se urmăreşte realizarea unui test pentru evaluarea inteligenţei, se pot avea 
în vedere următoarele relaţii ale constructului "inteligență" cu alte variabile 
(Gronlund, 1967; Kline, 1993): 

e Scorurile testului cresc cu vârsta (se presupune că inteligenţa creşte 

cu vârsta aproximativ până la 16 ani). 

e Scorurile testului prezic succesul şcolar. 

e Scorurile testului concordă cu aprecierile făcute de profesori despre 

inteligența elevilor. 

e Scorurile testului corelează pozitiv cu scorurile. unor teste aşa-numite 

"de inteligență". 

@ Dacă se efectuează analiza factorială asupra acestui test sia altor teste 

care măsoară aptitudini, se va constata că testul de inteligență are o 

saturație mare în primul factor general. — 

e Scorurile testului discriminează între un grup de copii handicapati 

mintal şi unul format din copii capabili de performanţe superioare. 

e Scorurile testului sunt influențate doar puio de procesul nseto 

urmat de subiect. 

e Scorurile testului discrimineaza intre diverse grupe ocupationale. 

- Unele profesii, precum cea de matematician sau de funcţionar superior, 
necesită o inteligență suuperioară, în timp ce altele pot fi exercitate Şi 
de persoane cu o inteligenţă redusă. 

Fiecare dintre afirmaţiile formulate în legătură cu constructul pe care 
testul trebuie să îl măsoare urmează să fie verificată experimental. Dacă unele 
dintre ele nu se confirmă, trebuie revăzută teoria care stă la baza constructului, 
pentru a sesiza eventualele omisiuni sau neconcordante. 
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2.2. DOMENIUL DE CONŢINUT AL UNUI TEST 


Prin domeniu de conţinut al unui test se înţelege "mulţimea tuturor 
comportamentelor care pot fi utilizate pentru a măsura atributul specific sau 
caracteristica la care se referă testul" (Murphy, Davidshofer, 1991). 

Definirea domeniului de conţinut este asemănătoare celei de definire a 
unui construct. Autorul testului, pe baza ideii pe care şi-a format-o despre ceea 
ce vrea să măsoare, reţine acele comportamente care presupune că ar fi 
manifestări ale constructului, respectiv, în cazul domeniului de conţinut, 
expresii ale performanţei sau ale cunoştinţelor subiecţilor. 

„Deosebirea dintre un construct şi un domeniu de conţinut constă numai 
în gradul de abstractizare implicat şi adesea este dificil de făcut distincţie între 
ele (Guion, 1986). 

Descrierea domeniului de conţinut trebuie în primul rând să precizeze 
limitele acestuia. Apoi, pentru fiecare componentă se apreciază importanţa. În 
cazul testelor destinate să măsoare rezultatele unui program de instruire 
(cunoştinţe sau deprinderi), descrierea domeniului de conţinut al testului se 
bazează pe analiza conţinutului şi a obiectivelor instructionale ale cursului urmat 
de persoanele care vor fi testate. Se încearcă să se includă în domeniul de 
conţinut aspectele pe care mai mulţi experţi le consideră importante. 


Exemplu. 
Un test de cunoştinţe de psihometrie, administrat studenţilor din anul 
III de la facultatea de psihologie, după predarea cursului de Psihodiagnostic, 
poate avea ca domeniu de conţinut "cunoaşterea noţiunilor de bază ale teoriei 
testelor, conform materiei predate la curs". 
Descrierea domeniului de conţinut cuprinde: 
a. limitele domeniului: se au în vedere cunoştinţele cuprinse în bibliografia 
indicată la curs (se anexează lista bibliografică); 
b. componentele domeniului: 
e probleme: analiza de itemi, validitatea testelor, fidelitatea testelor; 
e aspecte tratate: definițiile noţiunilor, metodele de cercetare, condiţiile 
de utilizare a metodelor de cercetare şi a formulelor de calcul; 
c. importanţa relativă a componentelor domeniului: este indicată în tabelul 2.2.1. 
Procentele se referă la timpul alocat fiecărei probleme id în cadrul cursurilor 
predate studenţilor. 


Tabelul 2.2.1 
| Importanţa componentelor domeniului de conţinut 
pentru un test de cunoştinţe de psihometrie 


Problema 


utilizare . 
14% 
ee su 
[Fidetiateatestlor | 6% | im | m 


„Există, însă, multe domenii de conținut care nu pot fi descrise detaliat 

„după modelul prezentat. De exemplu, domeniul de conținut al unui test de 

aptitudini cognitive poate fi format din itemi extrasi din teste cunoscute, care se 

consideră că evaluează aptitudinea respectivă. Într-o asemenea situație este 
dificil de precizat care sunt limitele domeniului de conținut. 


| Aspectul tratat . 


2.3. GRUPELE CONTRASTANTE 
2.3.1. Definiţia grupelor contrastante 


În multe cercetări efectuate în psihologie şi pedagogie se utilizează aşa- 
numitele grupe contrastante sau grupe extreme. Este vorba despre două loturi 
„de subiecţi care, în privinţa uneia sau a mai multor variabile fixate de cercetător, 
au valori diferite: foarte mici într-o grupă, foarte mari în cealaltă. 

Atunci când variabilele sunt măsurate pe scală de interval sau de raport, 
se poate da o definiţie matematică a grupelor contrastante. În acest scop, se 
realizează mai întâi o ordonare a variabilelor, după un anumit criteriu (de 
exemplu, se aşază în ordinea în care au fost înregistrate valorile lor). Apoi, 
pentru fiecare persoană, se transformă valorile variabilelor în cote standard Za 
utilizând mediile şi abaterile standard ale acestor variabile în mulţimea tuturor 
subiecţilor (mulţimea din care se formează cele două grupe extreme). Fiecărei 
persoane i se pune în corespondenţă un vector, ale cărui componente sunt egale 
cu cotele standard ale variabilelor, în ordinea stabilită. mek ii 
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DEFINIŢIA 2.3.1.1. Prin centru de greutate al unei mulţimi de vectori 
A=1aF(Gjp a a >1,23.,N) 
„se înţelege vectorul 
M=(I1j, 03305). 
are cărui componente m, sunt egale cu mediile aritmetice ale valorilor 
componentelor corespunzătoare, în mulţimea dată: | 
mF (ay tay +...tay) IN 
i=1,2,...,72. | 


DEFINIŢIA 2.3.1.2. (Albu, Pitariu, 1995c) Două grupe de subiecţi se numesc 
contrastante, la un prag de probabilitate fixat, p, dacă sunt îndeplinite 
următoarele două condiţii: 

a. Centrul de greutate al vectorilor corespunzători persoanelor unei grupe are 
toate componentele negative, semnificativ diferite de zero la pragul p, iar centrul 
de greutate al vectorilor corespunzători subiecţilor din cealaltă grupă are toate 
componentele pozitive, semnificativ diferite de zero la pragul p. | 

b. Componentele corespunzătoare ale celor două centre de greutate diferă 
semnificativ între ele, la pragul p fixat. 


Observaţii 

1. Prima condiţie din definiţia 2.3.1.2 asigură faptul că în grupa "bună” mediile 
valorilor variabilelor sunt superioare mediilor întregului lot, iar în grupa "slabă", 
ele sunt inferioare mediilor întregului eşantion. | 

„2. Cea de a doua condiţie impune ca pentru fiecare variabilă mediile celor două 
grupe să fie semnificativ diferite între ele. 


Fie (C,, C2) şi (G, G ) două perechi de grupe contrastante în sensul 
definiţiei 2.3.1.2, grupa C; având centrul de greutate 
E, aiar N na Î>1,2,3,4. 
‘C, şi C; sunt grupele "slabe", iar C, şi C, sunt grupele "bune". 


DEFINIȚIA 2.3.1.3. Se spune că elementele perechii (C,, C,) contrastează 
mai puternic decât elementele perechii (C;, C,) dacă are loc relația: 
min (ha: j=1,2,...,0} > min {|x3-xy|: j=1,2,...51} (2.3.1.1) 
Se spune că elementele celor două perechi contrastează la fel de 
puternic dacă are loc relaţia: 
min (| xl: j=1,2,...,0} = min (per: > 2) (2AL2) 
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2.3.2. Formarea grupelor contrastante 


Modul de formare a grupelor contrastante este dependent de numărul 
variabilelor alese şi de scala pe care acestea sunt măsurate. i 

În cazul unei singure variabile dihotomice, cum este sexul, popele 
contrastante corespund celor două valori ale variabilei. 

Dacă pentru formarea grupelor contrastante se utilizează o singură 
variabilă, măsurată pe scală ordinală, de interval sau de raport, atunci se începe 
prin a ierarhiza persoanele pe baza valorilor acestei variabile. În prima grupă, 
denumită de obicei “grupa slabă", vor fi incluse persoanele cu valorile cele mai 
mici ale variabilei, iar în cealaltă grupă, denumită "grupa buna", persoanele cu 
valorile cele mai mari. În literatura de specialitate există recomandarea ca cele 
două grupe să conţină câte 27% din totalul subiecţilor. Dar, din motive practice 
(se poate întâmpla ca mai multe persoane să aibă aceeaşi valoare a variabilei) se 
acceptă ca procentul celor incluşi în fiecare grupă să fie oui intre 25% si 
33%. 

; Uneori pentru iinet grupelor contrastante este necesar să se ia în 
considerare mai multe variabile, fiecare fiind măsurată pe scală ordinală, de 
interval sa de raport. Aşa se întâmplă, de pildă, când grupele trebuie să conţină 
persoane "cu succes profesional" şi, respectiv, persoane "cu insucces 
profesional", iar performanţa profesională se exprimă prin valorile mai multor | 
variabile. În asemenea situaţii, se procedează la ierarhizarea persoanelor după 
valorile fiecărei variabile şi la agregarea clasamentelor astfel formate. Din 
ierarhia rezultată se aleg cei aflaţi la extreme, ca şi în cazul descris mai sus. 
| În continuare va fi descris un algoritm de formare a grupelor ` 
contrastante aplicabil în cazul când numărul variabilelor utilizate este cel puţin 
egal cu 2 şi când variabilele sunt măsurate pe scală de interval. 

Algoritmul construieşte, la fiecare pas, o partiție a mulţimii de subiecți 
aplicând analiza de clusteri (Everitt, Dunn, 1983); în acest fel, clasele formate 
sunt omogene. Dintre clasele partitiei se determină cele care contrastează cel 
mai puternic. 

Fie S={S jas 2,63 mulţimea vectorilor n-dimensionali corespunzători 
celor N subiecţi pentru care se cunosc cotele standard la n variabile măsurate pe 
scală de interval sau de raport. Algoritmul care determină grupele contrastante 
ale mulţimii S acţionează astfel: 


Pasul 1: 


Se stabileşte volumul minim (numărul minim de persoane) al grupelor 
contrastante, N,» şi pragul de probabilitate utilizat la compararea mediilor, p. 
Se construieşte pe mulţimea S partitia discretă 
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P={{s,}, {52},...{Sy}}. 


Centrul de greutate al fiecărei clase {s,} este vectorul s,, i=1,2,...,N. 


Pasul 2: 

Se formează mulțimile: 
P. = mulțimea claselor partiției P care au toate componentele centrului de 
greutate negative; 
P, = mulțimea claselor partiției P care au toate componentele centrului de 
` greutate pozitive. 
Dacă P =Ø sau P,=Ø atunci se trece la pasul 4. 


Pasul 3: 
Se extrag din mulțimile P. şi R clasele care contin cel putin VW, 

elemente şi se formează mulțimile P min $i Ps min’ 
Pi iC: : C.eP, IC] Nmn? 
Pima {Cy : C,eP,, [C.A su) 
(S-a notat cu |C] şi |C,| numărul elementelor mulţimii C., respectiv al mulţimii 
C,.) 

sp Dacă Pin sau Pa min atunci se trece la pasul 4, în caz contrar se 
trece la pasul 5. 


Pasul 4: 

Se reunesc două clase din partitia P efectuând un pas al algoritmului 
analizei de clusteri. Se formează astfel o nouă partiție P pe mulţimea S. 

Daca partiția P are o singură clasă se trece la pasul 7. 

În caz contrar, pentru clasa formată la acest pas se determină centrul de 
greutate si se trece la pasul 2. 


Pasil aj 
Se determină mulţimea A alcătuită din toate perechile posibile formate 
dintr-o clasă din P min Şi O clasă din P} min care îndeplinesc condiţiile definiţiei 
2.3 lies | 
A={(C_,C,) : C_€P min Cx€Ps mins C. şi C, contrastante la pragul p} 
Dacă A=@ atunci se trece la pasul 4, în caz contrar se trece la pasul 6. 


Pasul 6: 


Se defineşte în mulţimea A relaţia de preordine total > astfel: 
(CC), (G_,G,) E€ A: 


33 


(C.,C,) 2 (G.,G,) <=> elementele perechii (G ,C ) contrastează mai 
puternic decât elementele perechii (G.,G,) sau elementele perechii (CC ) 
contrastează la fel de puternic ca şi elementele perechii (G.G). 

Se determină perechile (C.,C4)E€A pentru care 

(C.,C,) 2 (G.,G,) oricare ar fi o altă pereche (G_,G,)eA. 

Fiecare din aceste perechi este o soluţie a algoritmului. 

Se trece la pasul aa 


Pasul 7: STOP 


Atunci când algoritmul furnizează mai multe soluţii, se va alege aceea 
în care volumul fiecărei grupe este apropiat de valoarea 0.27xN. 

Dacă algoritmul nu găseşte soluţii, se pot forma grupe contrastante prin 
metoda descrisă anterior, bazată pe agregarea clasamentelor EC) n zâtoare 
celor n variabile. 


Exemplu ` 

S-a considerat o mulţime de 27 de persoane pentru care se cunosc cotele 
realizate la două scale necorelate liniar între ele (r=0.095). Fiecărei persoane i 
s-a ataşat un vector bidimensional, reprezentând scorurile standard la cele două . 
scale. 

‘Pentru început s-au agregat ierarhiile produse de scorurile scalelor 
însumând, pentru fiecare persoană, scorurile standard si ordonând subiecții după 
scorul total. S-au inclus în fiecare din grupele contrastante aproximativ un sfert 
din totalul persoanelor (mai precis, 25.926%). Punctele 'corespunzătoare 
subiecţilor din cele două clase sunt prezentate în figura 2.3.2.1. 

Se constată că în clasa "bună" sunt cuprinse şi persoane care la o scală 
au scoruri inferioare mediei lotului. De asemenea, în grupa "slabă" sunt incluse 
şi persoane care la o scală au realizat scoruri superioare mediei lotului. _ 

S-a aplicat pentru acest lot şi algoritmul prezentat mai sus. La pasul 20 
grupele contrastante au frecvenţe apropiate celor din exemplul anterior. Dar, de 
această data, toţi subiecţii din grupa "bună" au scoruri superioare mediei lotului, 
la ambele scale; de asemenea, toate persoanele din grupa "slabă" au scoruri 
inferioare mediei lotului, la ambéle scale (figura 2.3.2.2) . 
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xB X : 
X | B B x | B B 
nr ks X | BB 
S | xxB X | xBB 
—S$ : B-—-— X i X 
Sx a B SSS | X 
Sx| x SS. x 
S S X S Ss | X 
Sx a 
| | 
Figura 2.3.2.1 Figura 2.3.2.2 
Formarea grupelor contrastante Formarea grupelor contrastante 
prin ierarhizarea persoanelor prin aplicarea algoritmului 
în funcţie de scorul total descris mai sus 


Legendă: 

B = persoană din grupa "bună" 

S = persoană din grupa "slabă" 

X = persoană care nu face parte din grupele contrastante 


2.4. CRITERIUL 


În teoria testelor psihologice, prin criteriu se înțelege "o variabilă pe 
care încercăm să o prevedem în general cu ajutorul testelor” (Grand dictionnaire 
de la psychologie, 1994) sau "o măsură acceptată a comportamentului evaluat 
de test" (Corsini, 1994). În aprecierea personalului, criteriul este o "măsură a 
nivelului de performanţă exprimată în termeni cantitativi, ori pe o descriere 
completă a muncii prestate" (Corsini, 1994). 

Criteriul este ecologic-prin natura sa. El se referă la relaţia dintre 
persoane şi mediul lor (Barclay, 1968). 
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Variabila criteriu poate fi unidimensionala sau multidimensionala, cu 
valori cantitative sau/şi calitative. De exemplu, în selecţia profesională a 
managerilor o variabilă criteriu poate fi constituită din abilitatea de comunicare 
şi din capacitatea de organizare (apreciate prin câte un calificativ), din 
sociabilitate, persuasiune şi ambiţie (măsurate cu ajutorul unor scale, deci având . 
valori numerice). 
Performanţa în muncă este, de asemenea, un criteriu multidimensional. 
În compare sa intra aspecte ce tin de (Gilmer, 1971; Pitariu, 1994): 
e cantitatea realizată în unitatea de timp (piese piaduse, cuvinte 
dactilografiate, itemi codificati etc.); 
„e calitatea muncii (număr de piese rebutate, număr de erori de 
codificare etc.); 
e timpul de muncă neutilizat ponei întârzieri, Dau neautorizate 
ete); 
e stabilitatea în muncă @rechimea T în muncă, schimbări de profesie, 
transferări, demisii etc. eee 
e costul necesar pentru instruire (timpul de instruire pentru realizarea 
unei producţii standard, costul materialului stricat în pimp ul instruirii, 
viteza de avansare etc.); ` 
e cunoştinţele profesionale; 
„e satisfacția în muncă (număr de revendicări, a sugestii, examinări 
psihiatrice etc.); ȘI 
© evaluările făcute de superiori sau temeri 
Se recurge adesea la verificarea. corectitudinii unui test, în cadrul 
See! de validare a testului, prin compararea scorurilor sale cu măsurile unui 
criteriu, atunci când testul trebuie să înlocuiască variabila criteriu, fie din cauză 
că valorile variabilei criteriu nu sunt cunoscute în momentul testării, fie pentru 
că administrarea testului este mai puţin costisitoare decât măsurarea variabilei 
criteriu. 
Pentru a face posibilă aprecierea corectă a calităţilor testului cercetat, 
criteriul trebuie să îndeplinească următoarele cop cin (adaptare dupa Greuter, 
Algera, 1989 si Corsini, pp d 


dă Să fie relevant pentru activitatea sau caracteristica la care se referă, 
adică ordinea subiecților determinată pe baza valorilor criteriului să corespundă 
ordinii reale a aceştora în privinţa succesului obținut în activitatea respectivă sau 
a mărimii caracteristicii măsurate. Pentru aceasta este necesar ca variabila 
criteriu să ia valori într-o mulţime total ordonată ori să realizeze o măsurare pe 


scală ordinală, de interval sau de pase De obicei se prefera criteriile cu valori 
cantitative. i 
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B. Să fie fidel, adică să concorde cu diverse evaluări ale performanțelor 
la care el se referă, făcute la momente diferite şi/sau cu alte instrumente! de 
măsură, similare lui. Verificarea acestei condiţii se poate face cu ajutorul 
coeficientului de corelaţie. 


C. Să fie practic, adică să nu coste mult şi să fie acceptabil pentru cei 
care doresc să îl utilizeze la luarea deciziilor. Pentru îndeplinirea acestei condiţii 
este important ca în criteriu să fie înglobate principalele aspecte care sunt avute 
în vedere la aprecierea performanţei sau a mărimii caracteristicii măsurate. 
Identificarea acestora se poate face apelând la supervizori, respectiv la experţi. 


D. Să fie exprimat în aceleaşi unităţi sau în unităţi comparabile pentru 
toate persoanele. De exemplu, dacă valorile variabilei criteriu sunt dependente 
de vârsta subiecţilor, atunci aceste valori vor fi transformate în cote 
standardizate, pentru fiecare persoană fiind utilizate în formula de transformare 
media şi abaterea standard corespunzătoare grupei de vârstă din care aceasta 
face parte. 


E. Atunci când criteriul este multidimensional, valoarea criteriului 
pentru fiecare persoană să reflecte atât importanţa diverselor componente, cât 
şi nivelul individului la fiecare dintre ele. 


Anastasi (1954) enumeră câteva criterii utilizate în practica psihologică 
pentru analizarea validității testelor care măsoară constructe. Acestea sunt: 

a. Vârsta: se foloseşte drept criteriu pentru testele de inteligenţă, 
întrucât se consideră că scorurile acestora trebuie să crească pe parcursul 
copilăriei, până la maturitate. Nu este un criteriu bun pentru testele care măsoară 
funcțiuni psihice invariabile sau putin variabile în timp, cum sunt variabilele de 
personalitate. 

b. Cunostingele şcolare, exprimate prin note şcolare, rezultate la teste 
de cunoştinţe ori evaluări făcute de profesori asupra "inteligenței" elevilor: sunt 
adesea criterii pentru testele care măsoară aptitudinea şcolară. 

c. Performanțele la diverse programe de instruire specială, cum sunt | 
cursurile de dactilografie, programare, muzică etc.: furnizează criterii pentru 
teste de aptitudini speciale. 

d. Performanja profesională serveşte uneori drept criteriu pentru teste 
de personalitate. | 

e. Evaluările făcute de profesori, instructori sau superiori sunt folosite 
mai mult pentru a obţine informaţii despre alte criterii, cum ar fi cunoştinţele 
şcolare, performanţa la diverse cursuri, reuşita profesională. Au rol de criteriu 
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pentru unele teste care măsoară trăsături psihice, precum anxietatea, onestitatea, 
originalitatea etc. | Te i 
f. Rezultatele altor teste se utilizează ca si criteriu atunci când se 

„urmăreşte să se construiască un test care să măsoare acelaşi lucru ca şi criteriul 
dar să fie mai uşor de administrat sau/şi de cotat ori să fie mai ieftin. De 
exemplu, scala Stanford-Binet .a servit drept criteriu pentru multe teste de 
inteligenta sas supe vastus | iai bn “lt 

„g. Grupele contrastante reprezinta.de obicei un criteriu multidimensio- 
nal, care cuprinde aspecte diverse din viaţa zilnică. De exemplu, pentru un test - 
de inteligenţă grupele contrastante pot fi constituite dintr-o clasă de copii 
proveniţi de la o şcoală de debili mintali şi o clasă de elevi de aceeaşi vârstă - 
dintr-o şcoală obişnuită. Criteriul pe baza căruia s-au format grupele este alcătuit 
din ansamblul de factori care au determinat cuprinderea copiilor în şcoala 
ajutătoare. Grupele contrastante se folosesc frecvent ca şi criteriu pentru testele 
de: personalitate. De exemplu, pentru evaluarea unor trăsături legate de 
activitatea socială se poate forma o grupă de studenţi cu multiple preocupări 
extraşcolare şi una cu studenţi fără asemenea preocupări. 


Criteriile utilizate în cercetările asupra comportamentului pot fi 
clasificate din două puncte de vedere, ambele permiţând plasarea criteriilor de-a 
lungul unei axe (Barclay, 1968). Astfel: - 

e după modul de obţinere a valorilor lor, la un pol se plasează criteriile 

„subiective (valorile sunt furnizate. de Subiect), iar la celălalt, cele 
obiective (valorile sunt obţinute de la alte persoane sau cu ajutorul unor 
„ instrumente de măsură); i efi 
e după gradul în care valorile lor sunt dependente de contextul în care 
„se află persoana evaluată, la un pol se află criteriile individuale (valorile 
sunt independente de contextul în care se află persoana), iar la celălalt, 
cele de grup (comportamentele sunt puternic influențate de grupul din 
care face parte persoana evaluată cu ajutorul criteriului). 

„De exemplu, criterii subiective individuale sunt afirmaţiile făcute de 
subiect despre nivelul său de aspirație şi despre valorile sale spirituale, în timp 
ce criterii subiective de grup sunt relatările subiectului despre relaţiile sale cu 
alte persoane, despre recompensele şi pedepsele pe care le-a primit. Criterii 
obiective individuale sunt tehnicile Q-sort, iar dintre criteriile obiective de grup 
fac parte evaluările realizate de profesori şi observaţiile sistematice asupra 
comportamentului. | 

„Adesea, pentru un acelaşi test se găsesc mai multe criterii, fiecare 
referindu-se la un alt aspect. Aşa se întâmplă, de pildă, când testul trebuie să 
prevadă reuşita profesională. 
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..... 


În asemenea cazuri există două posibilităţi de a acţiona pentru a le lua 
în considerare pe toate: 

a. se combină criteriile într-un criteriu compus sau global; pe baza 
scorurilor criteriilor se calculează pentru fiecare persoană o cotă unică; 

b. se reunesc criteriile într-un criteriu multiplu: fiecare criteriu are o 
valoare particulară şi este utilizat separat în aprecierea testului. 

Prima variantă de lucru este mai convenabilă în privinţa prelucrării şi 
a interpretării datelor, întrucât fiecare persoană are un singur scor, care permite 
ierarhizarea candidaţilor. Pentru aplicarea sa, este necesar, însă, ca scorurile 
criteriilor să fie exprimate în aceleaşi unităţi de măsură: în scoruri standardizate, 
în ranguri, în unităţi de timp sau în costuri. 


Exemplu. 
Pentru munca de editare a textelor la calculator se pot fixa două variabile 
criteriu: 

e numărul de semne introduse într-o oră; 

e numărul de erori comise la introducerea acestor semne. 

Cu ajutorul acestor criterii se poate forma un criteriu global, care 
exprimă timpul necesar pentru a introduce corect un număr fixat de semne, N. 
Valoarea criteriului global, pentru fiecare persoană, se calculează însumând 
timpul în care sunt introduse cele X semne cu timpul necesar pentru depistarea 
erorilor comise şi corectarea lor. Prin combinarea criteriilor într-un criteriu 
global şi ierarhizarea persoanelor pe baza scorului astfel calculat se rezolvă o 
problemă de agregare a mai multor clasamente: ierarhiile de pornire 
(corespunzătoare scorurilor criteriilor) se înlocuiesc cu un singur clasament. 

În practica selecţiei profesionale se obişnuieşte să se combine liniar, 
ponderat sau neponderat, scorurile criteriilor pentru a obţine cota globală. În 
privinţa modului de stabilire a ponderilor, părerile sunt diverse. De exemplu, H. 
Toops (Brogden, Taylor, 1949) consideră că ponderile trebuie să reflecte 
importanţa fiecărui criteriu, apreciată de specialişti, in timp ce M.L. Blum şi JC. 
Naylor (1968) propun ca ponderile să fie proporţionale cu fidelitatea criteriilor. 

Procedeele de agregare a clasamentelor care însumează scorurile ponde- 
rate ale criteriilor prezintă un neajuns atunci când ierarhiile corespunzătoare 
criteriilor nu concordă între ele. Astfel, este posibil ca pe primele locuri ale 
ierarhiei finale să ajungă persoane care au obţinut scoruri modeste la mai multe 
criterii, dacă ele s-au aflat pe locuri fruntaşe în clasamentele corespunzătoare 
criteriilor cărora li se atribuie ponderi mari. 

Acest inconvenient poate avea urmări grave atunci când criteriile nu au 
un caracter compensatoriu. Dacă existenţa unor cunoştinţe sau deprinderi este 
absolut necesară desfăşurării cu succes a activităţii pentru care se face selecţia 
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şi nu poate fi compensată prin alte calităţi ale persoanei, de'asemenea necesare 
postului, aceste cunoştinţe sau deprinderi trebuie să constituie un criteriu care 
nu va putea fi, sub nici o formă, inclus într-un criteriu global (Landy, 1985). In 
asemenea situaţii trebuie să se utilizeze un criteriu multiplu. 


eo w se A 


lui în care este aplicat. Această calitate a testelor este denumită validitate de 
aspect (C. I. Mosier, după Nevo, 1993). iai ay. 

O definiţie operaţională a validitatii de aspect a fost formulata de L. 
Guttman şi S. Shye (Nevo, 1993) astfel: "Se face o măsurare a validitatii de 
aspect atunci când o persoană testată /un utilizator neprofesionist /un individ 
interesat, utilizând o tehnică absolută /relativă apreciază un item / un test / o 
baterie de teste drept foarte potrivit /.../ nepotrivit pentru utilizarea care îl 
interesează", H ke | | 
„ “Trebuie observat că aprecierea validității de aspect nu este realizată de |. 
experţi şi pentru măsurarea sa nu se folosesc metode psihometrice. Dacă 
aprecierea validității de aspect este făcută de persoanele testate, ele trebuie să 
îşi spună părerea imediat după terminarea testului, când impresiile sunt încă 
proaspete. Validitatea de aspect nu este inclusă printre celelalte tipuri de 
validitate (Standards for Educational and Psychological Tests, 1974) şi nici nu 
le poate înlocui, - pw i | pee pc 


2.6. VARIABILE MODERATOARE, VARIABILE 
MEDIATOARE 5 a ja Hi jst 


Noțiunea de variabilă moderatoare are mai multe acceptiuni. 

In termeni generali, o variabilă moderatoare este o variabilă calitativă 
(de exemplu, 'sexul, rasa, clasa socială) sau cantitativă (de exemplu, vârsta, 
anxietatea) care afectează direcţia şi/sau tăria relaţiei dintre o variabilă: 
independentă şi o variabilă dependentă (Baron, Kenny, 1986). - 
i Unii autori înţeleg prin variabilă moderatoare "o interacţiune între mai 
multe variabile care influenţează corelatiile uneia dintre variabile cu alte date" 
(Mischel, 1968). at RUC mi | 
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Procedeul statistic utilizat pentru a verifica dacă o variabilă indepen- 
dentă acţionează sau nu ca o variabilă moderatoare este determinat de felul în 
care au fost măsurate variabila independentă şi variabila moderatoare. Se face 
distincţie între cazul când variabilele sunt categoriale, adică discrete, măsurate 
pe scală nominală sau ordinală, şi cel în care ele sunt continue, măsurate pe 
scală de interval sau de raport. 

Atunci când variabila dependentă este continuă sunt posibile următoa- 
rele situaţii (Hofstee, Smid, 1986; Baron, Kenny, 1986): 


A. Variabila independentă şi variabila moderatoare sunt ambele 
categoriale. 

În acest caz se aplică analiza de varianţă bidimensională pentru a 
cerceta efectul variabilei independente şi al variabilei despre care se presupune 
că este moderatoare, asupra variabilei dependente. Existenţa efectului moderator 
este indicată de prezenţa interdependentei dintre variabila independentă şi cea 
moderatoare. 7 


B. Una dintre cele două variabile (independentă şi moderatoare) este 
continua, iar cealaltă categorială. 

În acest caz se determină ecuaţia de regresie a variabilei dependente faţă 
de variabila continuă, pentru fiecare valoare a variabilei categoriale. Dacă există 
un efect moderator, atunci dreptele de regresie nu sunt paralele. 


C. Variabila moderatoare şi variabila independentă sunt ambele 
continue. | | 

Dacă se poate presupune că pentru variabila moderatoare există 
intervale de valori disjuncte consecutive, astfel încât relația dintre variabila 
independentă şi cea dependentă este aceeaşi în cadrul fiecărui interval dar se 
schimbă de la un interval la altul, atunci se poate proceda ca în cazul B, 
considerând fiecare interval ca o singură valoare. 

Dacă, însă, se presupune că relația dintre variabila independentă si cea 
dependentă variază continuu în funcție de valorile variabilei moderatoare, atunci 
se determină ecuatia de regresie a variabilei dependente Y față de variabila 
independentă X gi fata de variabila moderatoare Z, sub forma: | 

Y=aX+ bZ+cXZ+d i (2.6.1) 

Prezența efectului moderator este semnalată de valoarea nulă a 
coeficientul c. 

Alți autori (MacCallum, Mar, 1995) consideră că există un efect 
moderator dacă diferența dintre pătratele coeficientilor de corelație multiplă 
corespunzători ecuaţiilor de regresie | 
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Y=aX+bZ+cXZ+d | (2.6.2) 

şi- s tHe a 
=eX+fZ+g (2.6.3) 

este semnificativă statistic. ale ăi 


O variabilă U acţionează ca mediator între variabila independentă X şi 
cea dependentă .Y dacă sunt îndeplinite următoarele condiţii (Baron, Kenny, 
1986): ` F: 

e variaţia valorilor variabilei independente provoacă variația valorilor 
variabilei mediatoare; 

e variația valorilor variabilei ae late a determina variatia Salarilor 
variabilei dependente; 

e relaţia dintre variabila independentă şi. cea dependentă este 
semnificativă, dar devine slabă sau chiar inexistentă atunci când sunt controlate 
relaţiile dintre variabila independentă si cea mediatoare şi dintre variabila 
mediatoare şi cea dependentă. 

Procedeul statistic aplicat pentru verificarea existenţei efectului 
mediator constă în construirea ecuaţiilor de regresie 


U.= dă, A; - (2.6.4) 
Y.=cX. | | | (2.6.5) 
Y.=aX.+ bU. iua (e:6:6) 


unde X., Y. şi W reprezintă variabilele standardizate corespunzătoare 
variabilelor X, Y şi U (adică, variabile având media 0 şi abaterea standard 1). 

Dacă există efect mediator, atunci coeficienţii d, c şi b sunt 
semnificativi statistic, iar coeficientul a este mai mic decât c. Medierea perfectă 
apare atunci când, variabila mediatoare fiind controlată, variabila independentă 
nu are nici un efect asupra variabilei dependente. 

În general, în cercetările psihologice SR ‘sunt diverse 
caracteristici ale persoanelor, care transforma variabila de intrare in variabila de 
ieşire. 

„ Variabilele moderatoare sunt utilizate, atunci când relaţia dintre variabila 
„independentă şi cea dependentă este slabă, ea modificându-se de la o 
subpopulatie la alta. De exemplu, gradul în care o trăsătură psihică este 
relevantă pentru subiecţi acţionează ca variabilă moderatoare dacă trăsătura 
trebuie să prezică un anumit comportament. 

Variabilele mediatoare se folosesc atunci când există o relaţie strânsă 
între variabila independentă şi cea dependentă. 


Uneori, în spatele unei variabile moderatoare se află o variabilă 
mediatoare. 
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Exemplu. 

O cercetare privind anxietatea fata de calculator a studentilor psihologi 
(Pitariu, Albu, 1995) a evidenţiat faptul că între extraversiune şi convingerea 
studenţilor că nu pot învăţa să lucreze la calculator (unul dintre factorii anxietatii 
fata de calculator) intervine, ca variabilă mediatoare, modul în care subiecţii îşi 
apreciază cunoştinţele de informatică (nota pe care şi-o acordă). Variabila 
mediatoare corelează pozitiv cu extraversiunea şi negativ cu factorul anxietatii 
fata de calculator. Pe de altă parte, autoaprecierea subiecţilor corelează liniar 
pozitiv cu nivelul real al cunoştinţelor de informatică ale acestora, care este 
strâns legat de profilul liceului absolvit (liceu de matematică-fizică, de filologie, 
de arte etc.). Dacă cercetarea s-ar fi restrâns la mai puţine variabile, neluând în 
considerare nivelul cunoştinţelor de informatică -autoapreciat sau apreciat 
obiectiv- s-ar fi constatat că profilul liceului absolvit joacă rol de variabilă 
moderatoare între extraversiune şi anxietatea fata de calculator. 


În unele situaţii, o variabilă poate acţiona atât ca moderator, cât şi ca 
mediator. De exemplu, auto-eficienta (care a fost definită de A. Bandura ca 
"aprecierea făcută de individ asupra capacităţii proprii de a organiza şi executa 
acţiunile necesare pentru a atinge o anumită performanţă") funcţionează ca: 

e mediator între situaţia de lucru -apreciată din punctul de vedere al 
complexităţii lucrului şi al controlului deţinut de subiect- şi iniţiativa personală; 
aceasta înseamnă că atât controlul pe care îl are subiectul asupra muncii cât şi 
complexitatea lucrului au un efect direct asupra auto-eficientei sale şi aceasta are 
efect direct asupra iniţiativei personale; | 

e moderator în relaţia dintre situaţia de lucru şi iniţiativa personală; 
relaţia dintre controlul deţinut de subiect şi complexitatea lucrului, pe de o parte, 
şi iniţiativa personală, pe de altă parte, este dependentă de nivelul de auto- 
eficienţă (Speier, Frese, 1997). 


| _ CAPITOLUL 3 © i 
"VECHI ŞI NOU IN TESTAREA PSIHOLOGICA 


3.1. SCURT ISTORIC AL TESTELOR PSIHOLOGICE 


"Originea cuvântului "test" este incertă. Ipoteza cea mai probabilă este 
că el provine din cuvântul latin "testa", care denumeşte un fel de creuzet folosit 
la separarea substanţelor nobile de celelalte. O altă posibilitate ar fi ca la 
originea sa să stea cuvântul latin "testatio", care înseamnă dovadă, depunere ca 
martor. Testul ar desemna, în acest caz, o ocazie de a face dovada capacităților 
proprii. 

Începuturile testării psihologice se pierd în antichitate. Cu patru mii de 
ani în urmä, în Imperiul Chinez se utilizau teste de cunoștințe pentru selecția 
funcționarilor publici. 

În Evul Mediu, universitățile europene foloseau o serie de teste pentru 
promovarea studenților în ani superiori de studii. 

` Testele psihologice construite pe baze ştiinţifice datează doar de 
aproximativ o sută de ani. Apariţia lor este legată de constituirea, în a doua 
jumătate a seculului trecut, a psihologiei ştiinţifice şi, în cadrul ei, a metodelor 
psihometrice. O contribuţie importantă în acest domeniu şi-au adus-o, în 
Germania, Ernst Weber, Gustav Fechner şi Hermann Helmholz, prin preocupa- 
rea lor pentru măsurarea precisă a fenomenelor psihice, pentru punerea la punct 
a tehnicilor de analiză a reacţiilor şi pentru utilizarea metodelor matematice la 
interpretarea rezultatelor. În acelaşi timp, în Anglia, Sir Francis Galton (1822- 

1911), elev al lui Darwin, şi-a orientat cercetările spre măsurarea diferenţelor 
individuale. În cartea sa Hereditary Genius, editată în anul 1869, el formulează 
ideea că toate aptitudinile umane sunt distribuite conform curbei lui Gauss şi, 
deci, indivizii pot fi clasificați în funcţie de proprietăţile cunoscute ale legii 
repartifiei normale. 

In anul 1879, Wilhelm Wundt (1832-1920) a înfiinţat la Leipzig primul 
laborator de psihologie experimentală, iar Galton a publicat în revista "Brain" 
articolul Psychometric Experiments, în care afirmă necesitatea utilizării 
metodelor cantitative în ştiinţele umane şi introduce termenul psihometrie, pe 
care îl defineşte ca "arta de a impune operaţiilor spiritului măsura şi numărul, 
aşa cum se întâmplă, de exemplu, când : se determină timpul de reacţie al 
persoanelor" (Meuris, 1985). 

~~ Eleval lui Wundt si, apoi, al lui Galton, psihologul american James Mc 
Keen Cattell (1860-1944) publică în 1890, în revista engleză "Mind" articolul 
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` intitulat Mental tests and measurements, in care apare, pentru prima dată, 
termenul test, în sensul de "serie de probe psihologice utilizate pentru a studia 
diferenţele individuale". Noţiunea de "test" este, deci, asociată cu cea de 
"măsură". 

În 1897, Hermann Ebbinghaus elaborează un test de evaluare a 
capacitatii mintale pentru elevi, legând astfel psihometria de preocupările 
pedagogice. Putin mai târziu, în 1901, Ugo Pizzoli inaugurează folosirea testelor 
în orientarea profesională. 

Dar, încă de la începutul aplicării metodei testelor au apărut şi primele 
critici la adresa sa. Observatia făcută de C. Wissler, în 1901, la Universitatea 
Columbia, că notele şcolare corelează foarte puţin cu rezultatele testelor mintale 
a generat o atitudine de scepticism vizavi de utilitatea testelor. > 

Criticând faptul că majoritatea testelor existente evaluează funcţii 
psihice inferioare, Alfred Binet şi Victor Henri propun să se elaboreze teste 
pentru măsurarea unor "fenomene superioare ale spiritului, precum memoria, 
atenţia, imaginaţia, orientarea ideilor”. Stimulat de problema determinării celei 
mai bune metode de selecţie a copiilor cu inteligenţă inferioară, Alfred Binet 
publică, în 1905, în "Année psychologique", în colaborare cu Théodore Simon, 
un articol intitulat Méthodes nouvelles pour le diagnostic du niveau intellectuel 
des anormaux, în care prezintă 30 de probe pentru măsurarea inteligenţei în 
manifestările sale curente şi concrete. Scala metrică a inteligenţei elaborată de 
Binet şi Simon a avut un rol important în istoria testelor: ea este prima serie de 
teste mintale potrivită scopului pentru care a fost construită (clasificarea 
obiectivă a copiilor pe baza nivelului lor de inteligenţă, în funcţie de vârstă) şi 
a inspirat majoritatea realizărilor ulterioare în domeniul măsurării dezvoltării 
mintale. În 1916, Scala Binet-Simon a fost revizuită de către L.M. Terman, 
devenind cunoscuta Scală Stanford-Binet. L.M. Terman a sugerat multiplicarea 
coeficientului de inteligenţă cu 100 şi a propus utilizarea abrevierii IQ’ pentru 
coeficientul obţinut astfel. 

Primii ani ai secolului al XX-lea reposa un moment de cotitură în 
teoria testelor psihologice. 

Charles Spearman, în Anglia, PEDONE metoda analizei fetala $i, 
in 1914, publica lucrarea celebra The Theory of two Factors, in care afirma 
structura bifactorială a inteligenţei: existenţa factorului G, al inteligenţei 
generale, şi a factorilor de grup. Această teorie a condus la elaborarea a ~ 
numeroase teste mintale şi a stat la baza lucrărilor unor psihologi celebri, 
precum C. Burt, Ph. Vernon, G. Thomson şi L. L. Thurstone. 

În aceeaşi perioadă, în Elveţia, C. G. Jung scrie primele lucrări relative 
la testul său de asociere a cuvintelor; acesta este prima tehnică proiectivă 
inspirată de concepţii freudiene. În 1920, Hermann Rorschach (1884-1922) 
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prezintă in "Psychodiagnostik" Testul petelor de cerneală, lucrare care . 
constituie punctul de plecare al metodelor proiective. Dar, definiţia acestor 
metode nu va fi dată decât mai târziu, în 1939, de către Lawrence Frank, la patru — 
ani după ce P. Rosenzweig şi-a prezentat testul proiectiv Picture Frustration 
Study, bazat pe teoria stresului şi a frustrării. - | 
"Un moment important în.dezvoltarea metodei testelor îl reprezintă anul 
1917, când se face prima administrare colectivă a testelor mintale. Este vorba 
despre instrumentele create de Robert Yerkes şi colaboratorii săi, Army Alpha 
şi Army Beta, destinate recrutării soldaţilor americani care urmau să fie trimişi 
să lupte în Europa. De la acea dată, testarea colectivă va fi utilizată pe scară 
largă, mai ales în orientarea şcolară şi în cercetările psihologice şi pedagogice. 
Apariţia testelor de personalitate marchează o etapă nouă în dezvoltarea 
curentului psihometric. În 1914, Robert Woodworth a pus la punct primul 
chestionar de personalitate, Personal Data Sheet, în scopul de a standardiza 
interviurile psihiatrice. Câţiva ani mai târziu, Bruce Moore realizează un 
chestionar de interese, iar Edward Strong, un chestionar de interese vocationale. 
Utilizând analiza factorială, Raymond Cattell elaborează, în 1946, testul Sixteen 
Personality Factors (16PF), care are drept scop să evalueze şaisprezece trăsături 
fundamentale ale personalităţii. Ulterior, au apărut chestionare de personalitate, 
precum Minnesota Multiphasic Personality Inventory (MMPI) şi California 
Psychological Inventory (CPI), care investighează mai multe trăsături de 
personalitate, pentru ca, în perioada 1980-1990 să se accepte că numărul 
trăsăturilor fundamentale de personalitate poate fi redus la cinci Si să se pună 
bazele modului Big Five. Pornind de la această idee, Paul T. Costa şi Robert R. 
McCrae au pus la punct Chestionarul de Personalitate NEO, care evaluează cei 
„cinci superfactori ai personalităţii: neuroticismul, extraversiunea, caracterul 
„deschis, calitatea de a fi agreabil şi conştiinciozitatea. Ei sunt definiti astfel 
(Aiken, 1994): i i: aa’ | 
e neuroticismul: neliniştit vs. calm, nesigur vs. sigur, cu manifestări de 
autocompătimire vs. mulţumit de sine; | 
e extraversiunea: sociabil vs. retras, amator de distracţii vs. sobru, 
afectuos vs. rezervat; | | dis- : 
_ © caracterul deschis: cu imaginaţie vs. ancorat în realitate; cu preferinţă 
pentru variaţie vs. cu preferinţă pentru rutină, independent vs. conformist; 
e calitatea de a fi agreabil: sentimental vs. neîndurător; încrezător in 
alţii vs. suspicios, dornic să fie util vs. necooperant; | 
e conştiinciozitatea: organizat vs. dezorganizat, atent vs. neatent, 
autodisciplinat vs. lipsit de voinţă. | 
Faptul că în studiul personalităţii intervin mai ales elemente calitative 
ale comportamentului a făcut ca testul să nu mai poată fi privit ca o "măsură- 
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toare", cum se întâmpla în domeniul testelor de aptitudini. S-a ajuns astfel la o 
nouă definiţie a testului psihologic. Conform formulării date în 1933 de 
Asociaţia Internaţională de Psihotehnică, "testul este o probă definită, implicând 
o sarcină de realizat, identică pentru toţi subiecţii examinati, cu tehnici precise 
pentru aprecierea succesului ori a eşecului sau pentru notarea numerică a 
reuşitei”. Considerând că această definiţie ar fi aplicabilă numai testelor de 
inteligenţă, de aptitudini şi de cunoştinţe, P. Pichot o propune, în 1967, pe 
următoarea: "Se numeşte test mintal o situaţie experimentală standardizată, care 
serveşte drept stimul unui comportament. Acest comportament este evaluat 
printr-o comparare statistică cu acela al altor indivizi plasați în aceeaşi situaţie, 
ceea ce permite clasarea subiectului examinat, fie cantitativ, fie tipologic" 
(Roşca, 1972). 

După cel de-al doilea război mondial, utilizarea testelor s-a extins pe 
toate continentele, în domenii diverse: şcolar, profesional, terapeutic, social, 
militar, sportiv etc. 

Teoria testelor a cunoscut completări şi modificări substanţiale. Teoria 
clasică, expusă de F. M. Lord şi M. R. Novick, în 1968, în lucrarea de referinţă 
Statistical Theories of Mental Scores a fost reformulată, într-o versiune 
moderna, de D. W. Zimmerman, in 1976. Dar, ea este treptat inlocuita de teoria 
răspunsului la itemi (Item Response Theory) si de teoria stărilor şi a trăsăturilor 
latente (Latent State-Trait Theory). 

Necesitatea de a cota şi interpreta rapid un număr mare de teste a 
condus, încă din 1930, la construirea unor maşini care să calculeze scorurile 
testelor. Douăzeci de ani mai târziu, s-a realizat în acest scop o maşină 
electronică dotată cu un dispozitiv fotoelectric. Acum, construirea, 
administrarea, cotarea şi interpretarea rezultatelor testelor psihologice 
beneficiază de ajutorul calculatoarelor electronice. Datorită lor se poate pune în 
aplicare o idee mai veche, cea de "adaptare" a testului la particularitatile 
subiectului, astfel încât, utilizându-se cât mai puţini itemi să se obţină cât mai 
multă informatie despre persoana examinată. Este vorba de aşa-numitele feste 
psihologice adaptative. 


3.2. CÂTEVA TEORII ALE PERSONALITĂȚII ŞI IMPACTUL 
LOR ASUPRA PSIHOMETRIEI 


3.2.1. Definiţii 


A. În contextul teoriilor referitoare la personalitate, situaţia este 
înţeleasă ca un ansamblu format din patterne de stimuli, evenimente, persoane 
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şi factori afectivi care există la un moment dat (Reber, 1985). Conform 
dictionarului editat de Petrovsky şi Yaroshevsky ( 1985), o situaţie este un sistem 
de condiţii care induc şi mediază activitatea unei persoane, dar este exterior 
acesteia în ceea ce priveşte: | 
© spaţiul (este localizat în exteriorul subiectului); 
© timpul (este anterior acţiunilor subiectului); 
„e funcţionarea (acţionează independent de subiect)... | 
În cazul. testării psihologice, printre elementele situaţiei se află 
informaţiile comunicate subiecţilor despre natura şi scopul testării, condiţiile de 
administrare a testului, starea subiectului din momentul precedent testării -dacă 
aceasta are influență asupra comportamentului său-, precum şi consecințele pe 
care le-au avut asupra subiectului performanţele realizate la alte testări, 


__ B. Termenul trăsătură a fost definit în diverse moduri. El a fost utilizat 
în acelaşi sens ca şi "dimensiune", "dispoziţie" sau "caracteristică stabilă”. 
Într-una din acceptiuni, o trăsătură este o etichetă atribuită unui ansam- 
blu de comportamente observabile şi stabile, care îi deosebesc pe indivizi între 
ei. De exemplu, J. P. Guilford priveşte trăsătura ca fiind "o manieră durabilă în . 
care o persoană diferă de altele" (Corsini, 1994). În altă acceptiune, trăsătura 
este o "dimensiune" de-a lungul căreia indivizii ocupă poziţii diferite, în funcţie 
de "tendinţele pe care le au de a produce patterne consistente de gândire, simtire 
şi acţiune" (McCrae, Costa, 1995). Ocupându-se de raportul dintre trăsăturile 
de personalitate ca variabile dispozitionale care fixează structura personalităţii 
şi determinantii situationali, M. Golu afirmă că "o trăsătură este privită ca o 
mulţime de comportamente care tind să covarieze (să fie corelate) într-o manieră 
relativ constantă în decursul timpului, în grupe de indivizi şi în variate situaţii, 
în care un individ se deosebeşte de alții" (Marcus, 1997). 

__. După unii autori, trăsăturile sunt constructe de personalitate create de 
psihologi, deci noţiuni abstracte, fără existenţă reală, care se manifestă prin 
diverşi "indicatori ai trăsăturii" (patterne de motive, atitudini, comportamente) 
(McCrae, Costa, 1995). După alţii, trăsăturile sunt caracteristici, calităţi sau 
procese care există în persoane, fiind, deci, o realitate obiectivă. De exemplu, | 
G. W. Allport consideră că trăsătura este "o structură neuropsihica". In 
«accepțiunea sa, o trăsătură îi predispune pe indivizi să perceapă stimuli diferiţi 
ca având aceeaşi semnificaţie şi să răspundă la astfel de stimuli prin 
comportamente similare (Hall, Lindzey, 1985). A sp 


C. În psihologia ultimelor decenii s-a manifestat tendinţa de a face 


` distincție între stare (înţeleasă ca reacţie trecătoare la o situaţie) şi trăsătură 
(privită Ca o caracteristică relativ stabilă a personalităţii). 
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Lucrările elaborate de C. D. Spielberger şi colaboratorii săi enumeră 
următoarele caracteristici ale stărilor şi trăsăturilor (Spielberger, Gorsuch, 
Lushene, 1970; Spielberger, 1988; Steyer, Ferring, Schmitt, 1992): 

O stare (a personalităţii) este prezentă la un anumit moment. 
Intensitatea sa poate fi mai mare sau mai mica, in functie de situatia care a 
generat-o. Deşi stările sunt adesea trecătoare, ele pot să reapară atunci când sunt 
provocate de stimuli potriviti şi pot să dureze atât timp cât condiţiile care le-au 
determinat persistă. Reacţiile emoţionale sunt expresii ale stărilor de 
personalitate. 

Trăsătura este conceptualizată ca o tendinţă relativ stabilă a individului 
de a percepe lumea într-un anumit mod şi/sau de a reacţiona ori a se comporta 
într-o anumită manieră, cu o regularitate predictibilă. Intensitatea unei trăsături 
are influenţă asupra frecvenţei de manifestare şi a intensității stării 
corespunzătoare. Mai precis, cu cât o trăsătură este mai accentuată la o persoană, 
cu atât este mai mare probabilitatea ca aceasta să prezinte starea emoţională care 
corespunde trăsăturii în situaţii mai variate şi cu o intensitate mai mare. 

De exemplu, supărarea a fost definită ca stare şi ca trăsătură astfel: 

e Starea supărare este o stare emoţională care se manifestă prin 
încordare, iritare şi furie, însoţite de tensiune musculară şi de o activare a 
sistemului nervos vegetativ. Ea este îndreptată de obicei împotriva prietenilor 
şi a persoanelor iubite şi doar rareori asupra străinilor sau a persoanelor pe care 
subiectul nu le simte apropiate (Averill, 1980). 

e Trăsătura supărare reprezintă dispoziţia subiectului de a aprecia o 
gamă largă de situaţii ca fiind enervante sau nemultumitoare şi tendinţa sa de a 
reacţiona frecvent la acestea prin creşterea intensității stării de supărare 
(Spielberger, 1988). 

Au existat numeroase încercări de a identifica atributele care 
diferenţiază stările de trăsături. Dar, nu a putut fi formulată nici o condiţie 
necesară sau suficientă pentru a recunoaşte o stare sau o trăsătură. S-a recurs 
atunci la definirea categoriilor "stare" şi "trăsătură" prin câte un grup de atribute 
care corelează între ele (Chaplin, John, Goldberg, 1988; John, 1990). Astfel: 

e Stările sunt temporare, inconsistente de la o situaţie la alta, sunt de 
scurtă durată şi au cauză externă. Stările identifică acele comportamente care pot 
fi controlate prin manipularea situaţiei. 

e Trăsăturile sunt stabile în timp, consistente de la o situaţie la alta, sunt 
de durată lungă, au cauză internă şi pentru ca prezenţa lor să fie constatată este 
necesar să fie efectuate mai multe observaţii, în situaţii variate, decât în cazul 
stărilor. Trăsăturile permit predicția viitorului pe baza trecutului. 
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3.2.2. Câteva teorii ale personalităţii 


Deosebirea esenţială dintre diversele teorii referitoare la personalitate 
constă în ponderea pe care'o acordă rolului jucat de factorii interni (legaţi de 
persoană) şi de cei externi (legaţi de situaţie) în declanşarea, menţinerea şi 
modificarea comportamentului. Căutând să răspundă la întrebarea "de ce variază 
comportamentul intrapersonal şi cel interpersonal?", adeptii acestor teorii au 
efectuat cercetări prin care au încercat sa determine "când apar variaţii ale 
comportamentului”. Fiecare teorie şi-a constituit o metodologie proprie de 
cercetare, cu un mod specific de culegere şi prelucrare a datelor. 

= ` Multă vreme, până prin anii 1960-1970, teoriile şi cercetările referitoare 
la, personalitate au fost dominate de modelul trăsăturilor (trait model). 
Conform acestuia, comportamentul (C) este determinat de predispoziţii latente 
stabile ale persoanei (P), numite trăsături. Adică: | 

C = f(P). | 

Modelul trăsăturilor oferă posibilitatea de a concentra într-un set limitat 
de trăsături caracteristici afective, atitudinale şi comportamentale ale indivizilor. 
Dar, fiind o teorie descriptivă, el nu identifică mecanismele care stau la baza 
trăsăturilor. În acest model, "un psihograf al unei trăsături este ca un buletin 
meteorologic, bun pentru a vă spune dacă trebuie să purtaţi umbrela, dar sărac 
în furnizarea de explicaţii de ce ar putea să plouă" (Ozer, Reise, 1994)... 

În decursul timpului au fost elaborate modele cu o singură trăsătură 
(single-trait models) şi modele cu mai multe trăsături (multi-traits models). 

Pentru modelele din prima categorie, trăsătura este un aspect specific 
al personalităţii, care îndeplineşte următoarele condiţii: 

e este prezent la toate persoanele, dar în grade diferite; 

e este invariabil intraindividual; | 

* e joacă un rol important in determinarea comportamentului; 

e poate fi măsurat cu precizie. 

Aceste modele utilizează instrumente (scale, teste, chestionare) prin care 
evaluează câte o singură trăsătură. În lucrările referitoare la personalitate, despre 
o asemenea trăsătură se spune că este "de nivel inferior" sau "specifică". 
Specificitatea se referă la contextul in care este definită trăsătura, respectiv la 
varietatea situaţiilor în care trebuiesc observate comportamentele care servesc 
la definiţia trăsăturii respective. Cu cât numărul acestor situaţii este mai mic şi 
ele sunt mai asemănătoare între ele, cu atât trăsătura are un grad de specificitate 
mai mare. Spre exemplu, se vorbeşte despre trăsătura "anxietate", dar şi despre 
trăsăturile "anxietate faţă de calculator” şi "anxietate faţă de teste”. În primul caz 
trăsătura are o generalitate mai mare, o specificitate mai mică. Precizia cu care 
poate fi prezis un anumit comportament într-o situaţie particulară (cum ar fi 
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lucrul la calculator sau examenul psihologic) este mai mică pentru trăsăturile 
generale decât pentru trăsăturile specifice situaţiei. 

Unii autori au definit trăsături "legate de sarcină" (task-related 
personality traits). Este vorba despre trăsături, mai mult sau mai puţin generale, 
care pot servi la predicția succesului într-un anumit domeniu de activitate. Aşa 
“sunt, de exemplu, trăsăturile educaţionale studiate de B. de Raad (1996). 

Modelele cu mai multe trăsături operează la un nivel de abstractizare 
mai înalt decât modelele cu o singură trăsătură. Ele presupun că există un număr 
redus de trăsături fundamentale, globale, numite uneori "factori de nivel înalt" 
sau "superfactori", pe care încearcă să le identifice prelucrând prin analiză 
factorială rezultatele unor chestionare, observaţii şi teste obiective referitoare la _ 
trăsături specifice. Factorii rezultați sunt consideraţi ca surse ale trăsăturilor 
specifice (Boekaerts, 1996). Cele mai importante modele cu mai multe trăsături 
sunt: modelul lui Eysenck bazat pe neuroticism, extraversiune şi psihoticism, 
teoria tipurilor de personalitate şi modelul Big Five. 
| În mod firesc, apare întrebarea: care trăsături este mai important să fie 

evaluate de către psihologi, cele specifice sau cele globale? Cercetătorii susţin 
că alegerea trebuie dictată de scopul examinării psihologice: pentru "explicare", 
sunt mai utile trăsăturile globale, în timp ce pentru "predictie", cele specifice 
(Lay, 1997). 

În momentul definirii ei, fiecare trăsătură este pusă în legătură cu un' 
grup de comportamente, care servesc ca indicatori ai acesteia. De exemplu, J.P. 
Guilford defineşte empatia ca "o abilitate de a prezice, de a recunoaşte 
dispoziţiile psihologice ale unei alte persoane, percepțiile sale, gândurile, 
sentimentele şi atitudinile, de asemenea, ca trăsături proprii" (Marcus, 1997). 
Pentru aprecierea gradului în care trăsătura este prezentă la fiecare persoană, se 
utilizează un model aditiv, care constă din următorii paşi: 

(1) Se evaluează unul sau mai multe din următoarelor criterii (G. W. 
Allport, după Corsini, 1994): 

e frecvenţa cu care apar comportamentele; 
e varietatea situaţiilor în care apar; 

e intensitatea cu care se manifestă; 

e durata lor. 

(2) Se cumulează măsurile obţinute. 

(3) Pe baza valorii rezultate, se fac inferente asupra măsurii trăsăturii. 
În acest scop se aplică un algoritm specific instrumentului utilizat la evaluarea 
criteriilor sau se compară valoarea obţinută pentru o persoană cu cele ale altor - 
indivizi. 

Testele şi chestionarele folosite cel mai des pentru colectarea datelor, 
atât în cercetare cât şi în psihologia aplicată (de exemplu, în clasificare, selecţie, 
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consultanță) au la bază modelul trăsăturilor. De asemenea, multe metode 
matematice utilizate frecvent de psihologi pornesc de la ipoteza existenţei unor 
variabile latente (corespunzătoare trăsăturilor) care sunt stabile în timp şi se 
manifestă prin intermediul variabilelor observate. Aşa sunt: analiza factorială, 
teoria clasică a testelor şi teoria răspunsului la itemi. 

Analiza factorială reduce o mulţime de variabile observate (scoruri de 
itemi, scale sau teste, rezultatele unor observaţii etc.), corelate liniar între ele, 
la un număr mai mic de variabile necorelate (factorii extraşi), cu ajutorul cărora 
se poate realiza o descriere obiectivă a persoanelor. Un factor este o combinaţie 
liniară ponderată a variabilelor prelucrate prin analiză factorială. Ponderile 
rezultă din calcule şi sunt determinate de valorile coeficienţilor de corelaţie 
liniară dintre variabilele măsurate. Factorii extraşi sunt concepte statistice. Ei 
reprezintă variabile latente (ce nu pot fi observate direct), care au legătură de 
corelaţie liniară cu variabilele observate prelucrate prin analiza factorială. Ei nu | 
corespund totdeauna unor caracteristici reale ale persoanelor sau unor trăsături. 
Semnificaţia fiecărui factor se deduce în urma analizei valorilor ponderilor 
variabilelor observate. 

Teoria clasică a testelor foloseşte descompunerea scorului observat la 
test, scală sau item în scor real şi în eroare de măsură. Scorul observat 
reprezintă rezultatul unei măsurători, în timp ce scorul real corespunde unei 
variabile latente. Dacă instrumentul utilizat în investigaţie serveşte la evaluarea 
unei trăsături, atunci scorul real este tocmai măsura trăsăturii respective. Teoria 
clasică a testelor utilizează în studiul relaţiei dintre variabile modelul liniar. În 
consecinţă, gradul de acord dintre variabile este exprimat prin intermediul unui 
coeficient de corelaţie liniară. 

În teoria răspunsului la itemi, spre deosebire de teoria SPARI a 
testelor, relația dintre scorurile itemilor și valoarea variabilei latente măsurate 
de test este exprimată analitic printr-o funcție de regresie neliniară. Dacă itemul 
funcționează corect, funcția de regresie este monotonă (crescătoare sau 
descrescătoare). 

Teoriile referitoare la personalitate au 1 analizat variabilitatea comporta- 
mentelor sub două aspecte: al consistenfei (constanta comportamentului in 
diverse situații existente la momente foarte apropiate între ele) şi al stabilității 
temporare (constanţa comportamentului în situaţii asemănătoare dar distantate 
în timp). Cercetările efectuate au evidenţiat grupe de comportamente asemănă- 
toare în ceea ce priveşte variabilitatea intrapersonală şi categorii de persoane 
_ pentru care unele comportamente se manifesta. asemănător în privinţa 
variabilitatii. 

Astfel, s-a observat ca atat consistenta cât şi stabilitatea temporară sunt 
mai mari pentru comportamentele care sunt asociate cu inteligenţa sau cu 
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procese demite Etichetele referitoare la personalitate, pe care le folosesc 
indivizii pentru a se descrie în scalele de autoevaluare, au o stabilitate temporară 
mare (Mischel, 1968). E. L. Kelly, administrând mai multe chestionare unor 
cupluri, de două ori, la un interval de 16-19 ani, a constatat că, spre deosebire 
de atitudinile față de căsătorie, care s-au schimbat mult şi în diverse moduri, 
încrederea în sine, sociabilitatea, unele interese, unele valori economice şi 
politice evaluate prin chestionare au avut o stabilitate temporară mare (Mischel, 
1968). 

Cercetările experimentale au IE oul la două observaţii importante: 

e Persoanele se deosebesc între ele în ceea ce priveşte variabilitatea 
comportamentelor de la o ocazie (Situaţie sau moment de observare) la alta, 
unele fiind mai schimbătoare, iar altele mai consecvente. Unii autori susţin că 
pentru fiecare aspect al personalităţii există trăsături generale care au rol 
moderator asupra variabilitatii intrapersonale. De exemplu, R. J. Larsen şi 
colaboratorii săi au observat că variaţia ciclică săptămânală a dispoziţiilor este 
mai evidentă la introvertiţi decât la extravertiti (Penner, Shiffman ș.a., 1994). 

e La un acelaşi individ, consistenţa comportamentală de la o situaţie la 
alta se manifestă asemănător pentru mai multe comportamente, nu doar pentru . 
cele specifice unei anumite trăsături (Amelang, Borkenau, 1986). Pornind de la 
această observaţie, s-a definit o variabilă continuă, considerată de unii ca fiind 
o "trăsătură", care reprezintă consistenţa comportamentală generală. Persoanele 
cu valori mari ale acestei variabile sunt doar puţin dependente de situaţie. 

S-a. încercat să se determine cauza care face ca la o persoană 
comportamentele asociate cu unele trăsături să varieze mult de la o situaţie la 

alta, iar cele legate de alte trăsături, să fie constante. S-a observat că trăsăturile 
cărora le corespund comportamente puţin variabile sunt cele pe care indivizii le 
consideră "relevante" pentru ei (adică potrivite pentru a-i descrie) sau 

"observabile" (adică destul de evidenţiate pentru a putea fi observate de alţii) 
(Amelang, Borkenau, 1986). Probabil că, într-un profil al personalităţii care ar 
îngloba foarte multe trăsături, acestora le-ar e a punctele de extrem (de: 
minim sau de maxim). 

O posibilitate de evaluare a constantei (consistenţei şi stabilității 
temporare) unei trăsături pentru o persoană constă în analizarea similaritatii 
profilurilor corespunzătoare mai multor manifestări comportamentale, construite 
în situații diferite, şi a similaritatii profilurilor corespunzătoare unor situaţii 
diverse, construite pentru diferite comportamente care au legătură cu trăsătura 
respectivă. Similaritatęa perfectă este considerată o dovadă a constantei 
individuale (Schmitt, Borkenau, 1992). | 

Pe o poziţie opusă modelului trăsăturilor se situează modelul 
situationist (situationism model), ale cărui baze au apărut pe la începutul seco- 
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lului al XX-lea. El a fost puternic influenţat de sociologie, datorită numărului 
mare de cercetări efectuate asupra rolului mediului (al factorilor geografici, 
socio-economici, profesionali,  familiali etc.) în dezvoltarea personalităţii. 
Conform acestui model, rolul principal în determinarea comportamentului (C) 
îl au factorii situationali sau stimulii prezenţi în fiecare situaţie (S): 

C = f(S) 

Modelul situationist neagă rolul caracteristicilor individuale, al factori- 
lor intrapsihici şi al antecedentelor personale, asupra comportamentului. Adepții 
acestui model au considerat că relaţia persoană-mediu poate fi reprodusă în 
laborator prin diverse experimente, iar variabilele independente şi cele 
dependente pot fi clar identificate şi operationalizate în factori cauzali şi efecte. 

Reprezentanţii situationismului nu au creat metode noi de colectare sau 
de prelucrare a datelor. În general culegerea datelor s-a bazat pe contabilizarea 
răspunsurilor comportamentale, iar metoda statistică aplicată cel mai frecvent 
a constituit-o analiza de varianta. 
| Deşi bazele sale teoretice au fost puse în perioada 1920-1930, modelul 
interactionist (interactionism model) s-a dezvoltat doar după anul 1960. Prima 
conferinţă internajională asupra interagtipnii om-situatie a avut loc la Stockholm 
în 1975. 

Modelul interactionist recunoaşte influenţa mediului asupra comporta- 
mentului, dar, în acelaşi timp, evidenţiază rolul factorilor personali în determi- 
narea acţiunii. Conform acestui model, comportamentul este rezultatul unei 
interacțiuni continue între mecanismele psihologice şi factorii de mediu: 

C = f(P, S5) | 

Teoriile interactioniste au identificat urmatoarele filed de interactiune 
intre tă ip şi situaţie (Hettema, Kenrick, 1992): 

a. interacţiune statică: atât trăsăturile persoanelor cât Şi caracteristicile 
mediului rămân relativ neschimbate o perioadă mai îndelungată; 

b. persoana alete situaţia: deşi uneori confruntarea persoanelor cu 
situaţiile este întâmplătoare, de obicei persoanele caută mediul care convine cel — 
mai. mult caracteristicilor proprii şi din acest motiv ocolesc sau parsers 
situatiile care nu le satisfac; 

c. situaţia alege persoana: unele situaţii sunt accesibile numai anumitor 
persoane (de exemplu, nu orice absolvent de liceu poate să îşi continue studiile 
la o facultate); 

d. persoana transformă situaţia: se presupune că persoana şi-a antes 
un scop şi acţionează pentru a-l'realiza, modificând situaţia; 

e. situaţia transformă persoana: persoana îşi adaptează comportamentul 
la cerinţele situaţiei, iar dacă este confruntată repetat cu aceleaşi constrângeri, 
îşi modifică propriile caracteristici; A 
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__ f. persoana şi situaţia tranzacţionează între ele: persoana schimbă unele 
caracteristici ale mediului pentru a-l face convenabil trăsăturilor sale, dar în 
acelaşi timp îşi schimbă unele caracteristici (comportamente, acţiuni, scopuri, 
gânduri, sentimente, motive), pentru a se adapta situaţiei. 

Interactionismul clasic punea accentul pe interacţiunea reciprocă, dina- 
mică şi continuă, dintre individ şi mediu. Modelele moderne ale interactionis- 
mului se ocupă cu interacţiunea dintre acţiuni şi scopuri, dintre emoție şi 
cogniţie, dintre factorii biologici şi cei sociali, acordând o importanţă deosebită 
studiului adaptării şi al copingului la stres. 

Adepții modelului interactionist au considerat că metodele utilizate până 
atunci pentru culegerea şi prelucrarea datelor nu sunt potrivite pentru cercetarea 
personalităţii. Ei au înlocuit chestionarele obişnuite cu chestionarele de tip S-R 
(situaţie-răspuns), dezvoltate de N. S. Endler, J. McV. Hunt şi A. J. Rosenstein. 
In aceste chestionare raspunsurile gi situatiile sunt luate in considerare simultan. 

La prelucrarea datelor, modelul interactionist utilizează metode noi, 
precum modelul Markov pentru studierea proceselor in care intervin interactiuni 
continue şi modelele descriptive pentru formarea grupelor omogene de indivizi 
pe baza patternurilor de reacţii la situaţii diverse (Endler, Magnusson,. 1976). 
„Teoria stărilor şi a trăsăturilor latente, dezvoltată în ultimul deceniu, are la 
bază modelul interactionist. 


3.3. EVALUARE PSIHOMETRICA SAU EVALUARE 
COMPORTAMENTALĂ ? 


Evaluarea este un domeniu al psihologiei ştiinţifice -în parte metodolo- 
gica, în parte aplicativă- care se ocupă cu explorarea, aprecierea şi măsurarea 
unor evenimente psihologice (Fernândez-Ballesteros, 1993) 

_ Evaluarea psihologică are drept scop să aprecieze individul, în general 
în legătură cu una sau mai multe probleme specifice, cum sunt: functiunile 
intelectuale, trăsăturile de personalitate, aptitudinile speciale, problemele de 
sănătate, dificultăţile de învăţare, comportarea şcolară, diverse variabile emo- 
tionale şi sociale. Ea a apărut o dată cu testele de inteligenţă, la începutul acestui 
„secol. S-a dezvoltat pe măsură ce au fost elaborate testele de personalitate, 
educaţionale şi vocationale, din necesitatea de a se pune la punct proceduri 
statistice care să permită crearea, analizarea şi îmbunătăţirea testelor. Teoria şi 
tehnologia instrumentelor propuse în acest scop au fost denumite "psihome- 
trice", iar evaluarea bazată pe ele, evaluare psihometrică. Ea reprezintă una 
dintre variantele evaluării psihologice tradiţionale. 
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Faptul că apariţia psihometriei este legată de utilizarea pe scară largă a 
testelor a făcut ca denumirile de "metoda testelor" şi "metoda psihometrica" să . 
fie uneori folosite ca sinonime. În principal, psihometria se ocupă cu analiza de 
itemi, cu studiul validității şi al fidelității şi cu etalonarea testelor. 

Prin anii 1960 în evaluarea psihologică a apărut un curent nou: 
evaluarea comportamentală. Aceasta are ca obiectiv măsurarea directă a 
comportamentului subiecţilor. Ea încearcă să descopere ce fac indivizii, unde, 
când şi în ce circumstanje. Baza pentru evaluarea şi predicția comportamentului 
o formează, în această abordare, comportamentul motoriu şi verbal manifest; nu 
se mai fac inferente sau interpretări ale unor rezultate de test. 

Expresia "evaluare comportamentală” a devenit comună în cercetările 
legate de modificările de comportament şi în terapie la jumătatea deceniului al 
optulea, când se considera că abordarea comportamentală are rolul "de a 
identifica şi măsura unităţile de răspuns şi variabilele care le controlează (ce ţin 
de mediu sau de organism), în scopul. înţelegerii şi al modificării comporta- 
mentului uman" (R. O. Nelson şi S. C. Hayes, citat după Silva, 1993). 

De la apariţia sa, evaluarea comportamentală s-a delimitat de evaluarea 
psihometrică, atât în privinţa scopului, cât şi a metodelor utilizate. Sunt foarte 
concludente în acest sens normele metodologice pe care şi le-a fixat (Fernândez. - 
Ballesteros, 1993); | | 

e Principala metodă de măsurare este observarea comportamentului. 

e Chestionarele de personalitate sunt incapabile să descrie 

probabilitatea răspunsurilor sau variabilele care afectează aceste 

probabilitati, deci ele vor fi abandonate. 

e Se va renunţa la testele tradiţionale, care evaluează trăsături psihice 

` (cum sunt structurile mintale), şi la principiile lor psihometrice. 

Dar, deşi adepţii evaluării comportamentale au opus rezistență 
psihometriei, aceste reguli nu au putut fi respectate. Din contră, în decursul 
ultimelor două decenii au existat mai multe tentative de apropiere a evaluării | 

‘comportamentale de evaluarea psihometrică. Astfel, s-au construit instrumente 
de evaluare a comportamentului utilizându-se tehnici statistice, s-au făcut studii 
asupra structurii factoriale a chestionarelor, s-a cercetat validitatea concurentă 
a măsurătorilor furnizate de observaţii sau de interviuri. În repetate rânduri s-a 
subliniat necesitatea de a se lucra şi în evaluarea comportamentului cu 
instrumente corespunzătoare ca validitate şi fidelitate, care să fie verificate prin 
metode psihometrice. t í 

Constatarea că există factori care nu pot fi masurati direct, precum 
motivația, dar care influențează comportamentul a avut drept consecință 
restrângerea utilizării procedurilor de observare a comportamentului şi utilizarea 
din ce în ce mai frecventă a chestionarelor de autoevaluare. i 
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Testele psihologice continua sa fie aplicate în practică şi de susţinătorii 
evaluării comportamentale. De pildă, în revistele Behavioral Assessment (în 
perioada 1980-1987) şi Journal of (Psychopathology and) Behavioral 
Assessment (in perioada 1979-1986) mai mult de 25% dintre articole se ocupau 
cu constructia de teste (Fernandez-Ballesteros, 1993). Dar, se poate observa 
tendinta ca fiecare tip de evaluare -psihometrică şi comportamentală- să 
folosească instrumente specifice de măsurare. Fernândez-Ballesteros (1993) a 
prelucrat, prin analiza corespondentelor, articolele publicate în perioada 1989- 
1991, în revistele Behavioral Assessment, Journal of Psychopathology and 
Behavioral Assessment şi Psychological Assessment, din punctul de vedere al 
metodologiilor aplicate si a constatat formarea a două grupări separate net şi 
aflate la poluri opuse ale aceleiaşi axe: una conţine lucrările despre construcţia 
de teste, tehnicile proiective, scalele psihopatologice, testele de inteligenţă şi 
MMPI (apărute, evident, în Psychological Assessment), cealaltă cuprinde 
articolele referitoare la observaţii, design experimental, chestionare de 
autoevaluare şi interviuri (publicate în Behavioral Assessment). păzi; 

De-a lungul timpului, evaluarea comportamentală şi-a sporit interesul 
pentru metodologie. Au fost create metode proprii de măsurare (de exemplu, 
tehnici de observare, proceduri fiziologice, interviuri structurate, tipuri noi de 
scale de evaluare a persoanelor de către alte persoane etc.). 

Analizând toate rezumatele articolelor din PsycLIT (Psychological 
Abstract în versiunea CD-ROM) referitoare la evaluarea comportamentală, 
apărute în anii 1980-1982 şi 1990-1992, Cone (1993) observă între cele două 
perioade o creştere a frecvenţei lucrărilor cu conţinut metodologic (de la 31.8% 
la 46.0%) şi o scădere a frecvenţei celor cu conţinut aplicativ (de la 40% la 
25.5%). | 

-În cadrul evaluării comportamentale au fost elaborate si utilizate, în 
ultimii zece ani, un număr foarte mare de modele, strategii, instrumente si 
practici de evaluare. Această observație l-a condus pe D. J. Cone, în 1986, la 
concluzia că "nu există o singură evaluare comportamentală, ci mai multe" 
(Silva, 1993). Totuşi, în 1988, D. J. Cone reduce toate modelele de evaluare 
comportamentală la două, opuse din punctul de vedere al abordării pe care o au 
la bază (Silva, 1993): bine 

© abordarea nomotetică a trăsăturii (nomothetic-trait approach), care 
are ca obiect de studiu trăsături sau sindroame (de exemplu, anxietatea 
socială, depresia, agorafobia), dezvoltă instrumente pentru evaluarea lor 
deductivă şi stabileşte adecvanta acestor instrumente pe baZa modului în 
care variază scorurile lor între indivizi; instrumentele sunt folosite pentru 
a măsura efectele variabilelor independente în cadrul grupelor de subiecţi 
sau pentru a evalua efectele intervențiilor aplicate indivizilor; 
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e abordarea idiografică a comportamentului (idiographic-behavior 
approach), care are ca obiect de studiu un comportament specific, 
dezvoltă procedee pentru evaluarea sa inductivă şi stabileşte adecvanta 
acestor proceduri. ţinând cont de modul în care variază scorurile 
aceluiaşi individ. 


Abordarea nomotetică are la bază presupunerile că atunci când 
instrumentele de evaluare sunt precise se pune în evidenţă o consistenţă a 
comportamentului persoanelor şi că măsurile trăsăturilor permit o predictie bună 
a comportamentului (Pushton, Jackson, Paunonen, 1981). Ambele presupuneri 
au fost infirmate de practică. Observatia că puterea predictivă a testelor de 
personalitate pentru un anumit comportament este, în general, destul de scăzută, 
a fost explicată prin faptul că abordarea nomotetică se bazează pe "ideea falsă" 
că orice trăsătură este "universal aplicabilă tuturor persoanelor”, când, în 
realitate, fiecare individ are anumite trăsături relevante. Cele care nu îi sunt 
relevante nu permit predicția comportamentului care este caracteristic acelei 
trăsături (Paunonen, Jackson, 1985). Opusă acestei concepţii, abordarea 
idiografică susține că fiecărei persoane îi sunt specifice anumite determinante 
ale comportamentului şi pe acestea încearcă să le identifice. În abordarea 
nomotetica se caută legile generale sau ecuaţiile care se aplică tuturor | 
persoanelor, în timp ce în abordarea idiografică se încearcă să: se determine 
ecuaţiile proprii fiecărui individ. ' 

Procedura statistică la care face apel abordarea nomotetică este analiza 
de regresie, mai precis construirea funcției de regresie care leagă predictorul (o 
trăsătură de personalitate) de criteriu (un comportament). Pentru obținerea 
ecuației funcției de regresie se utilizează date de la un eşantion, iar ecuația 
obținută serveşte la predicţia-comportamentului tuturor indivizilor din populație. 
Prin strategiile idiografice se identifică persoanele pentru care este potrivită o 
anumită ecuaţie de predictie a comportamentului pe baza trăsăturii. 

Se poate vedea că termenul "abordare nomotetică a trăsăturii” defineşte 
de fapt concepţia care stă la baza evaluării tradiţionale (Silva, 1993). Unii 
psihologi exclud acest tip de abordare din evaluarea comportamentală. 

Încercările de îndepărtare a evaluării comportamentale de evaluarea 
psiholometrică pun accentul pe deosebirile existente între ele. Una dintre acestea 
se referă la presupunerile făcute asupra comportamentului. 

În teoria psihometrică, scorul-ebservat la un test este compus dintr-un 
scor real şi O€roare de măsură. Scorul real reflectă o entitate internă stabilă, deci 
nu se schimbă (cel puţin într-un interval scurt de timp). Din acest motiv, un 
instrument de măsură este apreciat ca fiind bun, dacă scorurile observate la o 
aceeaşi persoană, în două ocazii, nu diferă prea mult, 
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In concepţia evaluării comportamentale, comportamentul nu este, în 
mod necesar, stabil. Variația scorurilor observate la un test, pentru un acelaşi 
individ, poate fi cauzată de schimbările produse în comportamentul acestuia şi 
nu neapărat de imprecizia intrumentului de măsură. Atunci când apelează, 
totuşi, la teste, evaluarea comportamentală caută să explice cauzele schimbării, 
să determine variabilele responsabile de aceasta şi nu face nici o presupunere 
asupra erorii de măsură. 

Întrucât evaluarea comportamentală susține dependența de situație a 
comportamentului, ea nu utilizează validarea concurentă ca mijloc de predictie 
şi nici nu pretinde să se obțină valori mari ale coeficientului de fidelitate test- 
retest. , 

Cu toate deosebirile existente între ele, amine psihometrica si cea 
comportamentală prezintă acum mai multe similaritati decât in urmă cu trei 
decenii (Fernandez-Ballesteros, 1993). 


3.4. TENDINŢE NOI ÎN STUDIUL PERSONALITÂŢII: 
MODELUL BIG FIVE ŞI MODELUL CIRCUMPLEX 


3.4.1. Modelul Big Five 


Modelul Big Five este un produs al abordarii lexicale a personalităţii. 

La baza acestei abordării stau următoarele două ipoteze fundamentale 
(Saucier, Goldberg, 1996); $ 

e Cele mai răspândite, semnificative şi distinctive atribute fenotipice 

tind să fie exprimate printr-un singur cuvânt. 

e Gradul de reprezentare a unui atribut în limbaj tinde să corespundă 

importanţei relative a atributului. | 

Altfel spus, "acele diferente individuale care au cea mai mare 
semnificaţie în tranzacţiile zilnice dintre persoane vor fi, în cele din urmă, 
encodate în limbajul lor. Cu cât este mai importantă o asemenea diferenţă, cu 
atât mai mult indivizii o vor remarca şi vor vorbi despre ea, rezultatul fiind că 
vor ajunge să inventeze un cuvânt pentru ea (L.R. Goldberg, după Hendriks, 
1997). | 

Pornind de la aceste presupuneri, o modalitate de a descrie domeniul 
trăsăturilor o constituie realizarea unui dicţionar redus, care să conţină toţi: 
termenii relevanti referitori la personalitate. Primul care a facut acest lucru se 
pare că a fost Sir Francis Galton, în 1884. Dar, mai importantă decât lista sa este 
cea extrasă de G. W. Allport si H. S. Odbert din Webster's New International 


59 


Dictionary (editia din 1925), formata din aproape 18000 de descriptori, cuvinte 
care deosebesc comportamentul unei persoane de cel al alteia. Dintre acesti 
termeni, 4504 se referă la trăsături. Se poate afirma că ei stau la originea 
modelului cu cinci factori. 

În 1934, L. L. Thurstone a apelat la 1300 de persoane pentru a evalua, 
fiecare, un individ pe care îl cunoaşte bine, folosind o listă compusă din 60 de 
adjective. Prelucrând prin analiză factorială rezultatele obţinute, el a ajuns la 
concluzia că personalitatea poate fi explicată prin cinci factori independenţi. 

Pe de altă parte, R. B. Cattell, pornind de la lista cu cei 4504 termeni 
referitori la trăsături a lui Allport şi Odbert, a aplicat analiza factorială şi, prin 
rotaţie oblică, a obţinut 12 factori, dintre care primii cinci apar cu saturatii mari. 
Ei sunt greu de interpretat, dar Cattell susține că aceştia reprezintă cele mai 
importante dimensiuni ale personalităţii (John, 1990). 

Adevăraţii descoperitori ai modelului Big Five sunt, însă, E. C. Tupes. 
şi R. E. Christal, care au analizat mai multe lucrări dedicate scalelor bipolare 
construite de Cattell şi au găsit cinci factori de personalitate. 

În anii următori, numeroase studii efectuate asupra unor chestionare de 
evaluare sau de autoevaluare şi asupra unor liste de adjective ori de verbe, 
realizate pe eşantioane de subiecţi de sexe, vârste şi naţionalităţi diferite şi prin 
metode diferite de analiză au pus în evidenţă câte cinci factori, în majoritatea 
cazurilor asemănători între ei. Ei au fost denumiți de Lewis Goldberg, în 1981, 
Big Five, pentru că fiecare dintre ei acoperă un domeniu. foarte larg şi cuprinde 
un număr mare de caracteristici de personalitate, distincte între ele şi specifice 
fiecărui factor. 

Deşi numele atribuit factorilor diferă de la un autor la altul, consensul 
în ceea ce priveşte conţinutul: psihologic al acestora este destul de mare. 
Prezentăm în continuare semnificaţia factorilor şi câteva dintre denumirile sub 
care sunt cunoscuţi (John, 1990; Zlate, 1994; Minulescu, 1996): 

e Extraversia, sociabilitatea şi ambitia, atracţia interpersonală, 
afirmarea, puterea, izbucnirea (Surgency) - arată capacitatea de orientare a 
personalităţii către exterior, modul de implicare în acţiune, sociabilitatea 
persoanei. 

e Agreabilitatea, sap BRA socială, plăcerea, nivelul socializării, 
amabilitatea, dragostea - se referă la calităţile emoţionale ale ` persoanei şi la 
comportamentele ei prosociale. 

e Conştiinciozitatea, conformitatea, dependenţa, responsabilitatea, 
prudenta, autocontrolul, interesul pentru muncă, puterea realizării - vizează 
modul concret, caracteristic al individului de a trata sarcinile, activităţile, 
problemele care apar în viaţa lui; cuprinde trăsături cum ar fi ordinea, disciplina, 
responsabilitatea socială. | 


60 


e Stabilitatea emoţională, controlul emotional, emotionalitatea, neuroti- 
cismul, adaptarea, anxietatea, afectul - arată caracteristicile emoţionale ale 
persoanei (calm, mulţumit, emotiv) şi diferite dificultăţi emoţionale (anxietate, 
depresie, iritabilitate). 

e Cultura, intelectul, curiozitatea intelectului, inteligenţa, subtilitatea, 
deschiderea, independenţa, grija/atentia - se referă la funcţiile intelectuale 
(creativitate, inventivitate, deschidere la arene). 


Deosebirile existente intre conținuturile factorilor si, în consecință, între 
denumirile atribuite lor, la diverşi autori, provin din faptul că elementele 
introduse în prelucrare prin analiză factorială (cuvinte care exprimă trăsături, 
itemi,. scale etc.) nu sunt indicatori puri ai factorilor (J. A. Johnson, 'F. 
Ostendorf, după Johnson, 1996). De obicei, fiecare element are o saturație foarte 
mare într-un factor ("factorul primar") şi o saturație mare în alt factor ("factorul 
secundar"). Pentru a se determina ce măsoară factorii se grupează elementele 
care au acelaşi factor primar şi se analizează conținutul acestora. Deosebirile 
dintre concluziile formulate de diversi autori sunt cauzate de faptul ca factorii 
secundari la elementele grupate pentru un acelaşi factor primar diferă de la un 
„studiu la altul. De exemplu, o scală alcătuită din itemi care se referă la 
constiinciozitate, dar care au saturatii mari pozitive în factorul extraversiune, va - 
conduce spre o altă denumire a factorului "conştiinciozitate” decât o scală 
compusă din itemi care vizează conştiinciozitatea dar au saturatii mari negative 
în factorul extraversiune. În primul caz denumirea dată factorului "conştiin- 
ciozitate" va indica o formă extravertită a constiinciozitatii, iar în al doilea caz, 
o formă introvertită. 

Într-un model al persoanei, prezentat în 1994, de R.R. McCrae şi P.T. 
Costa, cei cinci factori din modelul Big Five sunt văzuţi ca dispoziţii psihice 
fundamentale, care au baze biologice, nu sunt observabile direct şi oferă 
explicaţii pentru o categorie de fapte psihice numite "adaptări psihice". Acestea 
din urmă sunt caracteristici dobândite şi includ obiceiuri, atitudini, deprinderi, 
valori şi motive. La rândul lor, adaptările caracteristice furnizează explicaţii 
pentru comportamentele observabile (gânduri, sentimente, acţiuni, adică ceea 
ce evaluează de obicei persoanele din jur) (Minulescu, 1996). i 

Unele cercetări au arătat că fiecare dintre cei cinci factori este legat de 
bunăstarea psihică si de adaptarea din adolescență (Ozer, Reise, 1994). 

Un model de evaluare a personalității acceptat de psihologi în ultimii 
ani constă dintr-o structură ierarhică; în vârf se găsesc cei cinci factori din 
modelul Big Five (numiţi, uneori, superfactori), iar sub aceştia sunt plasate 
diverse fațete, care sunt măsurate prin instrumente ce se referă la aspecte 
înguste ale personalităţii (Goldberg, 1996). 
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În ceea ce priveşte setul optim de fatete, psihologii nu au ajuns încă la 
un acord. De exemplu, în modelul ABSC propus de Hofstee, de Raad si 
Goldberg există 45 de dimensiuni bipolare, în timp ce în modelul Five Factors 
al lui Costa şi Mc Crae, operationalizat in NEO-PI-R, sunt prezente 30 de 
dimensiuni bipolare. | 

În orice caz, sunt considerate mai utile chestionarele care cuprind scale 
corespunzătoare fatetelor decât cele care au doar scale de evaluare a 
superfactorilor (Goldberg, 1996). Aceasta, deoarece din primele se poate ajunge 
cu uşurinţă la superfactori, în timp ce drumul invers este imposibil. 

Au fost construite mai multe liste de termeni şi chestionare care măsoară 
cei cinci superfactori ori fațete ale acestora. 

S-au reţinut în liste: verbe (care indică "ce face o persoană"), adverbe 
(care arată "cum face" ceva persoana), adjective (care exprimă "de ce" se 
comportă persoana într-un anumit fel) şi substantive (care denumesc trăsăturile) - 
(Zlate, 1994). Cea mai mare extindere o au listele alcătuite din adjective şi cele 
formate din substantive. Dar, se apreciază că asemenea descriptori compuşi 
dintr-un singur cuvânt nu sunt ideali pentru a fi utilizaţi ca itemi în chestionare 
de personalitate (Goldberg, 1996). Mai întâi, din cauza faptului că nici un 
limbaj nu cuprinde suficiente cuvinte pentru a surprinde toate nuanțele 
complexe în care este înţeleasă fiecare trăsătură. Apoi, pentru că adjectivele şi 
substantivele care se referă la trăsături au un nivel foarte înalt de abstractizare: 
două persoane înţeleg acelaşi termen în moduri diferite. De aceea, mulţi autori 
de chestionare preferă itemi care conţin specificaţii comportamentale sau 
contextuale. Pe de altă parte, nu totdeauna este posibil să se găsească o traducere 
potrivită în altă limbă a fiecărui termen printr-un singur cuvânt. | 

În general, itemii introdusi într-un chestionar de personalitate pot fi 
clasificați, din punct de vedere al aspectului vizat, astfel (Minulescu, 1996): 

e dupa specificitatea comportamentului: 

e abstracti (nespecifici); 
e concreti (specifici); 

e după specificitatea situationala: 

e conditionali (se referă la comportamente specifice pentru o 
anumită situaţie); 
e neconditionali (nu sunt sensibili la specificul situational). 

Pornind de la această clasificare, B. De Raad şi colaboratorii săi au găsit 
patru tipuri de itemi potriviti instrumentelor de tip Big Five (Minulescu, 1996): 

a. adjective singulare (de exemplu, extravert, stabil, conştient) care sunt 
simultan abstracte şi neconditionale; 

b. verbe singulare (de exemplu, se bâlbâie, roşeşte, insultă) care sunt 


Suen! si neconditionale; 
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c. propoziţii adjectivale (de exemplu, este deschis când se află în 
prezenţa altora) care sunt abstracte şi conditionale; 

d. propoziţii cu centrul de greutate pe sensul verbului (de exemplu, se 
bâlbâie când este în prezenţa unei poa de sex opus) care sunt concrete şi 
Bb 


In timp ce propoziţiile adjectivale apar frecvent în chestionarele de 
personalitate, propoziţiile centrate pe verb au fost rareori folosite. 

Printre cele mai utilizate liste de adjective construite pentru măsurarea 
celor cinci superfactori se află: . 
e 50-BRS (Bipolar Rating Scales), lista de adjective a lui L.R. Goldberg, care 
constă din 10 scale bipolare pentru fiecare superfactor;, 
e SACBIF (Short Adjective Checklist Big Five), o listă realizată de M. 
Perugini, L. Leone, L. Gallucci şi M. Lauriola, care cuprinde 50 de adjective 
bipolare pentru cele 5 scale referitoare la superfactori. 

Dintre chestionarele de personalitate construite după modelul Big Five 
amintim: 
e NEO-PI-R (NEO Personality Inventory Revised) al lui P.T. Costa şi R. R. 
McCrae, care măsoară câte şase fațete pentru fiecare superfactor. Există în 
circulaţie două variante ale chestionarului NEO-PI-R, ambele compuse din câte 
240 de itemi: Forma S, pentru autoevaluare, şi Forma R, pentru eteroevaluare. 
e FFP] (Five-Factor Personality Inventory) construit de A. A. J. Hendriks, W. 
K. B. Hofstee, B. d Raad şi A. Angleitner, care a fost realizat de la început în 
trei versiuni standardizate: olandeză, germană şi engleză. El constă din 100 de 
itemi, repartizaţi câte 20 pentru fiecare superfactor. _ 


3.4.2, Modelul Goon es 


Modelul cuie: a fost elaborat de J. S. Wiggins. El constă dintr-o 
reprezentare grafică a trăsăturilor interpersonale în interiorul unui cerc, în 
spaţiul bidimensional care are ca şi axe de coordonate Puterea (sau Dominanta) 
şi Dragostea (sau Pasiunea). Cercul are centrul în originea axelor, raza egală cu 
unitatea şi este împărţit în 16 sectoare egale. 

Wiggins a selectat, dintr-o listă cu 1710 adjective construită de 
Goldberg, 817 termeni care se referă la comportamente interpersonale. Apoi, a- 
studiat corelatiile dintre autoevaluările făcute de subiecţi la aceste adjective si, 
pe baza lor, a grupat termenii în 16 clase, fiecare corespunzând unui sector de 
cerc. Rafinări succesive ale acestor grupe de adjective au dus la formarea a 16 
scale, fiecare constând din 8 termeni. 
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Modelul circumplex a fost generalizat de Hofstee, De Raad si Goldberg 
(1992), cercul fiind înlocuit cu o sferă în spaţiul cu cinci dimensiuni, în care 
axele de coordonate corespund superfactorilor din modelul Big Five. Noul 
model este denumit 4B5C (Abridged Big Five Dimensional Circumplex). 
| În acest circumplex cu cinci dimensiuni fiecare trăsătură este 
caracterizată prin saturatiile sale în doi din cei cinci superfactori. Modelul 4B5C 
“poate fi privit ca fiind format din 10 circumplexe bidimensionale, de tipul celui 
construit de Wiggins, câte unul pentru fiecare combinaţie posibilă de doi factori. 
În fiecare circumplex bidimensional pe axele Ox şi Oy sunt reprezentaţi 
superfactorii din perechea considerată. De data aceasta cercul este împărţit în 12 
sectoare, fiecare având unghiul la centru egal cu 30°, poziţionate astfel încât 
axele de coordonate să fie bisectoare pentru patru dintre ele. 
| În acest circumplex sunt reprezentate numai trăsăturile care, după 
rotirea factorilor prin metoda varimax, au cele mai mari Saturatii în superfactorii 
cărora le corespund axele Ox şi Oy. 
„ Algoritmul de atribuire a unei trăsături la un sector constă din următorii 
paşi (Hofstee, De Raad, Goldberg, 1992): | | _ 


Pasul 1: e 
Se desenează punctul care are coordonatele rectangulare (x, y), unde x 
„este saturatia trăsăturii în superfactorul reprezentat pe axa Ox, iar y este saturația 
în superfactorul reprezentat pe axa Oy. 


Pasul 2: 

Se calculează lungimea proiectiei punctului pe bisectoarea sectorului 
de cerc din care face parte, astfel: = = Voia 

e dacă |x|>3.73|y| atunci punctul face parte dintr-un 'sector de cerc care 
are ca şi bisectoare axa Ox şi proiecția sa pe această axă are lungimea h=(x\; 

e daca |y|>3.73|x| atunci punctul face parte dintr-un sector de cerc care 
are ca şi bisectoare axa Oy şi proiecția sa pe această axă are lungimea h=Iy|; 

e daca nu sunt îndeplinite inegalităţile de mai sus, atunci punctul 
aparţine unui sector care nu conţine axele de coordonate şi proiecția sa pe 
bisectoarea sectorului se calculează cu formula: 

h = max {|x|,|y]} cos30° + min{|x],|y]} cos60° (3.4.2.1) 


Pasul 3 
Trăsăturile pentru care.proiectia are lungimea mai mică decât un prag 
fixat (de exemplu, decât 0.20) sunt eliminate din circumplex. | 
„După reprezentarea tuturor trăsăturilor, se analizează grupele din fiecare 
sector de cerc şi se caută denumirea cea mai potrivită pentru fiecare superfactor. 
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Deşi modelul ABSC nu diferă formal de modelul Big Five în ceea ce 
priveşte structura internă a personalităţii, el se deosebeşte de acesta prin faptul 
că introduce factori suplimentari printre factorii ortogonali: cei corespunzători 
bisectoarelor sectoarelor care nu conţin axele de coordonate (Johnson, 1993). 


( 


3.5. UTILIZAREA CALCULATOARELOR ÎN TESTAREA 
PSIHOLOGICĂ 


Utilizarea calculatoarelor în domeniul testării psihologice are o vechime 
de peste 40 de ani. La început, ele erau folosite doar pentru păstrarea şi analiza- 
rea rezultatelor la teste în cazul loturilor mari de subiecţi. Dar, evoluţia tehnicii 
de calcul şi, mai ales, necesităţile izvorâte din practică au provocat o diversifi- - 
care .a funcţiilor programelor destinate psihologilor. De exemplu, apariţia 
primului program pentru interpretarea rezultatelor unui test a fost determinată 
de acumularea unui număr foarte mare de lucrări referitoare la MMPI. Devenise 
imposibil, chiar şi pentru psihologii cei mai competenţi, să memoreze toate © 
informaţiile conţinute în acestea şi, cu atât mai mult, să le identifice rapid pe 
cele mai potrivite pentru interpretarea unui piate particular. 


Programele folosite azi în dometijul testarii psihologice îndeplinesc una 
sau mai multe din următoarele funcțiuni: 

a. păstrarea rezultatelor testării psihologice, în fişiere sau în baze de 
date. Prin aceasta se economiseste hârtie şi se reduce considerabil timpul 
„necesar pentru regăsirea informaţiilor despre o anumită persoană. Datele din 
fişiere pot servi la analizarea testelor (de exemplu, la verificarea validității 
acestora) sau la stabilirea unor etaloane. 

b. calculul scorurilor la teste. Se introduc în calculator răspunsurile 
date de un subiect la itemii testului şi, pe baza grilei, programul determină cotele 
brute ale scalelor. Asemenea programe sunt utile mai ales în cazul testelor 
compuse dintr-un număr mare de itemi, repartizaţi pe mai multe scale, cum sunt 
MMPI şi CPI. Există şi teste care nu pot fi cotate decât cu ajutorul calculatorului 
(de exemplu, testul de capacitate de organizare CO92). 

c. administrarea testelor, urmată, evident, de calculul școrurilor. 
Calculatorul poate administra teste exact în aceeaşi formă (aceiaşi itemi, în 
aceeaşi ordine) ca în varianta de administrare creion-hârtie sau poate "adapta" 
testele pentru fiecare subiect, extrăgând dintr-o colecţie de itemi pe cei care 
permit obţinerea unei informaţii cât mai precise despre persoana în cauză. Acest 
procedeu de lucru, denumit testare adaptativă cu ajutorul calculatorului 
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(Computerized Adaptive Testing, pe scurt, CAT) prezintă următoarele avantaje) 
„comparativ cu testarea obişnuită: ai 

e determinarea nivelului persoanelor în privinţa caracteristicii su e 

măsurate este mai precisă; 

e examinarea durează mai putin, testele adaptative fiind compuse dintr- 

un număr mai mic de itemi, şi, prin urmare subiectul este solicitat mai 

puţin, iar costul testării este mai redus; 

e securitatea testului este mai uşor de păstrat, întrucât Rai persoană 

examinată cunoaşte (si, deci, poate memora) doar un număr redus de 
itemi din totalul itemilor posibili. 

„În urma mai multor cercetări s-a constatat că forma de administrare a 
testului are influență asupra răspunsurilor date de subiecți (Murphy, 
Davidshofer, 1991). Din acest motiv, se impune să se determine şi să se 
utilizeze etaloane separate pentru fiecare mod de administrare a testului. 

Cu ajutorul calculatorului pot fi administrate teste prin care se măsoară 
variabile psihice sau fiziologice ce nu ar putea fi investigate în cazul 
administrării creion-hartie (de exemplu, timpul de reacţie, timpul de decizie, 
timpul i răspuns la fiecare item al unui chestionar etc.). 

d. identificarea protocoalelor invalide, în care răspunsurile subiectului 
nu sunt conforme cu realitatea (au fost date la întâmplare sau sunt influențate de 
dorinţa persoanei examinate de a apărea într-un anumit fel). Un procedeu 
utilizat în acest scop aplică teste statistice asupra succesiunilor de răspunsuri 
date de subiect (Huba, 1987). | 

e. verificarea unor ipoteze referitoare la persoana examinată, pe baza 
comparării, prin teste statistice, a rezultatelor obţinute de aceasta la examenul 
psihologic cu cele ale unui eşantion extras din populaţia căreia, îi aparţine 
subiectul. 

f. intervievarea subiectului. Programele contin, alături de întrebările 
posibile, şi un algoritm de construire a interviului, în timpul examenului 
psihologic, în funcţie de răspunsurile date de subiect. Interviurile realizate de 
calculator sunt mai flexibile decât chestionarele cu structură fixă. În plus, se 
pare că ele aduc informaţii mai precise decât interviurile conduse de psiholog, 
întrucât s-a constat că indivizii sunt, în general, mai dispuşi să comunice 
informaţii despre sine unei maşini, în particular unui calculator, decât unei alte 
persoane (Aiken, 1994). Dar, interviurile administrate de calculator au o utilitate 
redusă în cazul copiilor, al adulţilor cu un nivel intelectual scăzut şi al celor cu 
simptome psihiatrice. 

g. interpretarea rezultatelor la un test psihologic: Interpretarea testului 
de către calculator (Computer-based Test Interpretation, pe scurt, CBTI) are la 
bază transpunerea într-un program a unui set de reguli prespecificate, referitoare 
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la un răspuns sau la un pattern de răspunsuri (un scor de test sau un profil 
psihologic), care permit analiza, interpretarea şi evaluarea unor calităţi ale 
persoanelor (Harris, 1987). Cea mai simplă variantă de. interpretare constă în 
transformarea cotelor brute în scoruri standardizate (cote z sau cote 7) ori în 
ranguri percentile (decile, cuartile etc.) sau în calculul intervalelor de încredere 
pentru fiecare scor, Pe o treaptă superioară se află interpretările compuse din 
înşiruiri de adjective, iar la nivelul cel mai înalt, interpretările alcătuite din 
propoziții. Atunci când regulile aflate la baza algoritmului utilizat de program 
au fost emise de experţi sau au fost deduse din analiza statistică a unui număr 
foarte mare de rapoarte elaborate de psihologi competenţi, interpretările realizate 
de calculator sunt foarte asemănătoare celor produse de specialişti şi, în orice 
caz, sunt superioare celor formulate de un psiholog începător (Huba, 1987). 
Programele bune iau în considerare, alături de scorurile realizate de subiect, şi 
diverse date biografice. Însă, ele prezintă neajunsul că nu pot utiliza informaţii 
accesibile doar prin observaţie, cum sunt mimica sau gestica. 

h. redactarea raportului psihologic. Sunt prezentate explicaţii ale 
scorurilor obţinute la teste de persoana examinată sau implicaţii posibile ale 
acestor rezultate. Uneori sunt formulate predicții referitoare la subiect, fie pe 
baza unor metode statistice (de exemplu, folosind regresia liniară), fie pe baza 
identificării unor legături între scorurile la test şi unele caracteristici non-test, 
cum sunt datele biografice. Alteori, în urma comparării profilului psihologic al 
subiectului cu rezultatele obţinute la aceleaşi teste de diverse grupuri de 
persoane (de exemplu, grupuri care diferă între ele prin profesie, prin 
performanţa în muncă sau prin diagnosticul psihiatric) se determină populaţia 
din care face parte persoana examinată. 

i. alegerea tratamentului (a terapiei, a progi -amului de instruire etc.) 
cel mai potrivit pentru fiecare subiect. Acesta este cel mai înalt nivel de 
implicare a calculatorului în activitatea psihologului. Dar, programele de acest 
tip sunt rare deocamdată. 

j. construirea unui test psihologic. Sunt analizate, prin metode 
statistice, răspunsurile date la itemii testului de un lot numeros de persoane şi 
sunt identificaţi acei itemi care, puşi laolaltă, alcătuiesc un test cu calităţi cât mai 
bune. 

Fiind uşor de utilizat, programele de testare psihologică au cunoscut o 
mare răspândire. Mulţi consideră, în mod eronat, că asemenea programe pot 
înlocui psihologul sau că, la fel ca şi programele de jocuri, pot fi folosite oricând 
şi de oricine. 

În Standards for Educational and Psychological Testing (1985) ş şi î în 
Guidelines for Computer-Based Tests and Interpretations (1986) sunt precizate 
o serie de condiţii în care pot fi utilizate programele de testare psihologică. 
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Unele dintre acestea se referă la aspectele tehnice ale testării, iar altele, la 
obligaţiile care îi revin persoanei care le foloseşte. 

l De exemplu, în legătură cu administrarea testului, Guidelines for 
Computer-Based Tests and Interpretations formulează următoarele cerințe 
(Aiken, 1994): 

a. calculatorul utilizat la testare să fie plasat într-un loc liniştit, 
- confortabil şi lipsit de factori care să distragă atenția; 

b. itemii prezentați pe ecran să fie lizibili, iar strălucirea ecranului să fie 
potrivită; i i 

c. echipamentul să fie verificat periodic şi să funcționeze bine; 

d. persoana examinată să fie instruită î în privinţa modului de utilizare 
* a calculatorului; 

e. să i se ofere asistenţă persoanei examinate ori de câte ori este necesar 
şi să se urmărească comportarea acesteia la test; 

f. persoanelor care ar putea fi dezavantajată prin testarea cu ajutorul 
calculatorului să li se asigure o perioadă de acomodare. 

Standards for Educational and Psychological Tests din 1985 mentio- 
nează că recomandările referitoare la teste sunt valabile şi în cazul testării cu 
ajutorul calculatorului. Există, în plus, unele recomandări specifice, majoritatea 

vizând utilizarea interpretărilor furnizate de calculator. 

| Mulţi specialişti în domeniul testării psihologice, la fel ca şi diverse 
standarde elaborate de APA, atrag atenţia că programele de interpretare a 
testelor au doar rolul de a-l ajuta pe psiholog şi nu de a-l înlocui. Persoanele 
care folosesc un asemenea program trebuie să cunoască bine testul la care se 
referă acesta, să fie capabile ca, luând în considerare contextul în care s-a 
efectuat examenul psihologic şi diverse caracteristici ale subiectului, să 
recunoască dacă interpretarea propusă de calculator este corectă sau nu. De 
altfel, încă din 1966, în Automated test scoring and interpretation practices, 
APA atrăgea atenţia că realizarea interpretării unui test de către calculator 
trebuie privită ca o "consultaţie de la profesionist la profesionist", similară celor — 
oferite de psihologi studenţilor î în psihologie sau altor persoane pe care le 
supervizeaza. 


BS WALA CAPITOLUL 4 
CLASIFICARI ALE TESTELOR PSIHOLOGICE 


4.1. CLASIFICARI IN F UNCTIE DE CONTINUTUL TESTULUI 


A. După modul de executare a sarcinii de către subiect, testele se clasifică în: 

e teste orale; i 

e teste scrise ("creion-hârtie"); 

e teste de performanţă: 

e teste cu manipulare de aparate şi piese; 
e teste administrate de calculator. | 
În cazul testelor "creion-hartie", itemii sunt scriși pe hârtie, iar subiecţii 

răspund în scris, fie pe foaia care conţine testul, fie pe o foaie de răspuns. Există 
tendinţa de înlocuire a acestor teste cu testele administrate de calculator. Itemii 
nu mai apar pe hârtie, ci sunt afişaţi pe ecranul monitorului, iar subiectul nu mai 
răspunde pe hârtie, ci apasă o tastă sau manevrează mouse-ul ori creionul optic. 

Testele de performanţă impun subiecţilor să opereze cu obiecte, desene, 
aparate sau să efectueze activităţi complexe, asemănătoare situaţiilor din viaţa 
reală. În această categorie sunt incluse şi testele în care stimulii sunt constituiți 
din desene animate, prezentate pe un ecran, la televizor sau pe monitorul unui 
calculator. e“ : 

Spre deosebire de testele creion-hârtie, care, de obicei, se administrează 
colectiv, testele de performanță sunt utilizate individual sau în grupuri restrânse, 
atât datorită dificultății de a avea multe exemplare din materialele sau aparatele 
cu care persoanele examinate trebuie să lucreze, cât si pentru a evita ca subiecții 
să vadă ce realizează persoanele din jur. | 

În ultimii ani, a cunoscut o mare extindere examinarea psihologică cu 
ajutorul calculatorului. 


B. După gradul de utilizare a limbajului în rezolvarea sarcinii impuse de test 
se poate vorbi despre: | | 
e teste verbale (de exemplu, teste de raţionament verbal, teste de 
vocabular, teste care cer completarea unor propoziţii); 
e feste non-verbale (de exemplu, teste care cer urmărirea mintală a unui 
labirint, rotirea pe plan mintal a unei figuri, completarea unor figuri 
lacunare). 
În cazul testelor non-verbale nu se utilizează limbajul nici oral, nici în 
scris, nici în conținutul testului si nici în instrucțiunile acestuia. Asemenea teste 
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„sunt destinate persoanelor analfabete, cu deficienţe de auz sau-care nu cunosc 
‘limba folosită la examinare. - 

l Unii autori acceptă sub denumirea de teste non-verbale si probe in care 
utilizarea limbajului este redusă. Pentru asemenea teste au fost stabilite 
următoarele trei niveluri (English, English, 1970): 

e teste complet non-verbale (extrem de rare); 

e teste non-verbale în instrucțiuni, în forma de prezentare a sarcinii şi 

în modul de răspuns din partea subiectului, dar care acceptă utilizarea 

limbajului pe parcursul efectuării sarcinii (de exemplu, subiectul poate 
„comenta ceea ce face, vorbind singur); _ 

e teste în care numai răspunsul subiectului este non-verbal. 

Un test non-verbal poate fi test de performanţă sau test creion-hârtie. În 
ultimul caz testul constă din desene, diagrame sau simboluri non-lingvistice, iar 
subiectul răspunde prin efectuarea unor marcaje simple. Instrucţiunile sunt date 
prin gesturi sau pantomima, iar pentru demonstraţii se folosesc plange, tabele si ` 
diagrame. 

Uneori denumirea de "test non-verbal" este sinonimă cu aceea de "test 
de performanţă" şi desemnează un "test care cere răspunsuri motorii şi nu 
verbale" (English, English, 1970). Alteori clasificarea după gradul de utilizare 
a limbajului face distincţie între "testele verbale", "testele non-verbale" (care 
utilizează material figural) şi "testele de performanţă" (care utilizează diverse 
materiale concrete) (Roşca, 1972). 


C. După modul de procesare implicat (ce i se cere persoanei să facă pentru a 
da un răspuns) testele se clasifică în: 
e teste de eficienţă (teste intelective): 
e teste de aptitudini; 
e teste de dezvoltare mintală sau de inteligenţă; 
e teste de cunoştinţe; 
e probe de lucru; 
e teste situationale; 
© teste de personalitate (teste nonintelective): 
e chestionare de personalitate; 
e tehnici (teste) proiective; 
e teste obiective de personalitate. 
Unii autori includ testele de inteligenţă în categoria testelor de aptitudini 
(Reber, 1985). | 
În mod obişnuit, sub denumirea de teste de personalitate sunt cunoscute 
teste care se ocupă cu aspecte afective ori nonintelectuale sau cu comporta- 
mente. Unii psihologi cuprind în această categorie teste care se referă atât la 
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trăsături nonintelectuale, cât si la trăsături intelectuale (Anastasi, 1976). În 

terminologia testarii psihologice, totusi, prin teste de personalitate se inteleg cel 

mai frecvent măsurători ale unor caracteristici precum adaptarea emoţională, 

relaţiile interpersonale, motivaţia, trebuintele fundamentale, interesele, 

atitudinile (Anastasi, 1976; Tyler, 1963). Adesea, itemii lor se bazează pe 

expunerea unor convingeri sau-atitudini ("Eu cred că ..."; "Un lider ar trebui să 
."; Mă simt ..."). 

În brink prezentată mai sus, împărțirea în cele două grupe mari 
(teste de eficiență şi teste de personalitate) corespunde şi. nivelului de 
performanță evaluat de teste. Astfel, testele de eficiență măsoară performanța 
maximă a unei persoane, în timp ce testele de personalitate se referă la 
performanţa tipică (Corsini, 1994). 

Testele care evaluează performanţa maximă sunt compuse te item! la 
care se răspunde corect sau greşit. Ele furnizează de obicei un scor numeric, 
care permite ierarhizarea subiecţilor. 

În probele de personalitate nu există răspunsuri "bune" sau "rele". Ele 
evaluează în general diferenţe de stil între persoane. Pe baza rezultatelor lor nu 
se poate afirma că un subiect este, în privinţa tuturor variabilelor măsurate de . 
test, mai bun sau mai slab decât altul. 


e Testele de aptitudini 

Acestea sunt probe care oferă informaţii despre gradul de dezvoltare a 
variabilelor intelectuale, psihomotorii şi psihofiziologice (creativitate, 
coordonare manuală, percepţie cromatică). Ele permit construirea unui profil 
individual diferențiat şi stabilirea unei ierarhii între persoane. 

O clasificare a acestor probe cuprinde (Reber, 1985): 

e teste de aptitudini speciale: sunt cele care măsoară potenţialul pentru 

o singură aptitudine (de exemplu, mecanică, muzicală etc.); 

e ieste de aptitudini generale: ele determină potenţialul în domenii 

nespecifice (testele de inteligenţă fac parte din această categorie); 

e teste de aptitudini multiple: sunt baterii de teste care evaluează mai 

mulţi factori. 

Această clasificare nu este precisă. De La N testul de dexteritate a 
degetelor este "special" pentru o aptitudine specifică, dar măsoară un aspect al 
unei aptitudini generale senzorio-motorii. Unele teste de inteligenţă, care sunt 
teste de aptitudini generale, au fost prelucrate prin analiză factorială şi s-au pus 
în evidenţă componente verbale, numerice, analitice, spatiale etc., ce tin de 
| aptitudini particulare, speciale. 
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e Testele de inteligență 

Sunt denumite şi "teste de măsurare a dezvoltării intelectuale generale" 
(Roşca, 1972). Ele exprimă rezultatul prin intermediul unui coeficient de vârstă 
mintală sau de vârstă de dezvoltare. 

Există teste de inteligenţă verbale, teste cu conţinut figurativ şi teste în 
care rezolvarea constă în manipularea unui material concret. Testele de 
“inteligenţă pur verbale sunt rare; majoritatea testelor care sunt predominant 
verbale conţin şi probe non-verbale. 

| Exceptând testele de cunoştinţe utilizate în şcoli, testele de inteligență 
sunt testele folosite cel mai frecvent. 


e Testele de cunoştinţe. . 

Acestea constituie un mijloc de apreciere a fondului de informaţii al 
persoanei. 

Adesea se face distincţie între testele de cunoştinţe şi testele de: 
aptitudini. În timp ce testele de cunoştinţe îi cer persoanei examinate să 
furnizeze o informaţie (de exemplu, să spună cine a înfiinţat primul laborator de 
psihologie experimentală), testele de aptitudini îi pretind să efectueze o sarcină 
(de exemplu, pentru testarea rationamentului numeric, să spună câte mere va 
avea fiecare copil dacă se împart în mod egal 81 de mere la 27 de copii) 
(Hammond, 1995). 

Testele de cunoştinţe evaluează cantitatea de informații pe care a 
dobândit-o subiectul din experiența anterioară, în timp ce testele de aptitudini 
măsoară cât de mult este capabilă o persoană să rezolve o problemă concretă cu 
care nu a mai avut de-a face până atunci (Hammond, 1995). Dar această 
distincție bazată pe experiența anterioară nu este valabilă totdeauna, deoarece 
testele de aptitudini generale implică utilizarea unor principii învățate anterior. 

Deosebirea principală dintre testele de aptitudini si cele de cunoștințe 
este dată de direcția în care este orientat interesul examinatorului. El aplică un 
„test de aptitudini dacă doreşte să afle ce poate învăfa o persoană şi utilizează un 
test de cunoştinţe dacă vrea să ştie ce a învăţat individul până în momentul 
examinării (Thorndike, Hagen, 1961). 

Dar, ceea ce o persoană a înfăptuit în trecut este, de obicei, un indicator 
bun pentru ceea ce va putea ea realiza în viitor. Din acest motiv, unii psihologi 
preferă ca în locul denumirilor de "test de aptitudini” şi "test de cunoştinţe" să 
utilizeze termenul de "test de abilităţi" (Aiken, 1994). 

Deşi din definiţia testului se deduce că acesta este o probă standardizată, 
în cazul testelor de cunoştinţe se obişnuieşte să se vorbească despre (Gronlund, 
1967): 
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e teste standardizate (elaborate de specialişti, administrate, cotate şi 
interpretate în condiţii standardizate, destinate să fie utilizate pe scară 
largă); 

e teste informative (elaborate de profesorul care predă la o clasă si 

interpretate prin raportare la scorurile clasei respective). 

Deosebirea principală dintre testele standardizate şi cele informative 
este dată de scopul pentru care sunt folosite. Testele elaborate de către profesor 
se folosesc în primul rând pentru măsurarea îndeplinirii obiectivelor imediate 
din clasă şi, deci, se administrează grupului pentru care au fost întocmite. 
Testele standardizate se utilizează pentru a compara activitatea unui grup cu cea 
a altuia, pentru a compara rezultatele unei clase sau ale unui individ cu datele 
externe oferite de normele testului. Aceste deosebiri de scop determină diferenţe 
de structură, de administrare şi de interpretare între cele două tipuri de teste. 


Testele standardizate se deosebesc de cele informative din trei puncte 
de vedere (Lindeman, 1978): 

a. Testele standardizate sunt administrate totdeauna în aceleaşi condiţii. 
Fiecare test standardizat este însoţit de un manual, care include instrucţiuni 
pentru administrare şi cotare. Timpul alocat diverselor subsectiuni ale testului 
este menţionat în aceste instrucţiuni şi trebuie respectat cu stricteţe, pentru a 
putea interpreta rezultatele prin comparare cu cele obţinute de alt grup sau de 
altă persoană. 

b. Testele standardizate cuprind totdeauna norme, determinate pe baza 
unei populaţii numeroase. 

c. Testele standardizate acoperă o mai mare varietate de conţinut decât 
cele informative. Ele pot fi inadecvate pentru măsurarea unor obiective restrânse 
din anumite şcoli. 

O altă clasificare a testelor de cunoştinţe are la bază funcţia acestora. Se 
deosebesc, astfel (Gronlund, 1967; Guilbert, 1987): 

e teste cu criterii absolute (mastery tests), care verifică dacă subiecţii 

posedă cunoştinţele absolut necesare pentru un anumit scop 

(promovarea clasei, ocuparea unui post etc.); ele evaluează performanţa 

unui individ în raport cu un nivel de performanţă specificat dinainte; 

e teste cu criterii relative (survey tests), care servesc la ierarhizarea 

subiecţilor în funcţie de cunoştinţele acestora; 

e ieste diagnostice (diagnostic tests), care au rolul de a identifica 

deficienţele subiecţilor, cunoştinţele absente sau incomplete. 

Deci, testele cu criterii absolute se referă la performanţa minimă 
(subiecții trebuie să realizeze cel putin atât cât prevede criteriul absolut), testele 
cu criterii relative se referă la performanţa maximă (subiecţii sunt ierarhizati în 
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funcţie de scorul obţinut la test), iar testele diagnostice urmăresc depistarea 
domeniilor în care performanţa este foarte scăzută. 


e Probele de lucru 

Probele de lucru (work sample tests) sunt teste de performanţă bazate 
pe elemente care au legătură cu munca pe care o vor efectua subiecţii. Ele 
măsoară deprinderile implicate în toate aspectele importante ale muncii 
respective. Testele de acest fel se utilizează mai ales în cazul profesiilor care 
necesită manipulari de obiecte, fie pentru a măsura ceea ce a învăţat subiectul, 
` fie pentru a prezice ceea ce va putea învăţa (Downs, 1989). 

Unele probe de lucru (trainability worksample tests) se administrează 
înaintea unui program de instruire - a cărui lungime poate varia între o 
săptămână şi şase luni -, când persoanele nu sunt încă familiarizate cu 
activităţile pe care ar urma să le efectueze după ocuparea postului, pentru a 
prezice dacă subiecţii îşi vor însuşi deprinderile pe care respectivul program 
urmăreşte să le formeze. În majoritatea cazurilor, administrarea acestor teste se 
face după efectuarea selecţiei profesionale. 

Alte probe de lucru (job sample test) se utilizează după ocuparea 
postului de către subiecţi, pentru evaluarea deprinderilor însuşite de aceştia. Ele 
conţin eşantioane din munca efectuată la postul respectiv. De exemplu, pentru 
un post de secretară, o asemenea probă poate consta din editarea unui text la 
calculator. 


e Testele situationale 
Q Testele situationale sunt echivalentul probelor ie lucru în cazul 
profesiilor administrative. Ele permit evaluarea unor caracteristici care nu pot 
fi măsurate de testele cognitive. Dar, în general, sunt costisitoare şi consumă 
mult timp. Aceste teste sunt utilizate mai ales pentru selectarea managerilor. 

Principala deosebire dintre o probă de lucru şi un test situational constă 
în faptul că proba de lucru se referă doar la o parte a sarcinii care îi revine 
postului, în timp ce testul situational oglindeşte întreaga sarcină (P. M. 
Muchinsky, după Gregory, 1992). Probele de lucru pun accentul pe evaluarea 
de aptitudini şi de cunoştinţe, iar testele situationale se ocupă mai mult cu 
variabile emoţionale, sociale, atitudinale şi de personalitate. 

Testele situationale îl pun pe subiect în condiţii asemănătoare celor în 
care ar lucra dacă ar fi acceptat la selecţie şi determină cât de potrivit este 
răspunsul său. Scopul acestor teste este deghizat, persoana care îl rezolvă.nu îşi 
poate da seama care aspecte ale performanţei sale sunt observate şi cotate. 

Un test situational utilizat în selecţia profesională le poate oferi 
persoanelor examinate câteva probleme "reale" care cer îndeplinirea unei, sarcini 
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în condiţii de limitare a resurselor necesare (Gilmer, 1971). De exemplu, pentru 
ocuparea unui post de conducere al unui colectiv, candidatului i se poate pune 
la dispoziţie o echipă care să îl ajute în îndeplinirea sarcinii. Dar, membrii 
echipei sunt instruiți în prealabil să împiedice desfăşurarea activităţii, cât mai 
mult posibil. Se urmăreşte şi se cotează comportamentul celui examinat: cum 
„ştie să îi conducă pe cei "incompetenti", cum reacţionează la frustrare şi în ce 
măsură este capabil să ducă la bun sfârşit sarcina impusă de test. 

Un alt test situational este tehnica "in-basket", care simulează condiţiile 
de lucru ale unui administrator. Testul clasic in-basket este The Bureau of 
Business In-Basket Test al lui N. Frederikson (Gregory, 1992), care constă din 
scrisori, însemnări în agenda de lucru, notițe despre apeluri telefonice şi alte 
documente care au fost adunate în coşul de pe masa de lucru a unui director la 
o firmă care se ocupă de afaceri. Subiectului i se cere să îşi imagineze că trebuie 
să tina locul directorului şi să îndeplinească sarcinile acestuia. El va trebui să 
dea telefoane, să alcătuiască scrisori, să răspundă la interviuri. Se apreciază atât 
conţinutul, cât şi stilul răspunsurilor sale, urmărindu-se şi modul în care 
subiectul ştie să colaboreze cu personalul firmei. 


e Chestionarele de personalitate 

Chestionarele de personalitate sunt compuse din una sau mai multe 
scale. O scală de personalitate este alcătuită dintr-o mulţime finită de declaraţii 
descriptive, numite itemi, care sunt relevante pentru o anumită trăsătură 
comună, adică pentru o anumită dimensiune a personalităţii, prezentă în grade 
diferite la indivizi diferiţi (de exemplu, anxietatea, agresivitatea) (Edwards, 
1970). 

După conţinutul aspectelor cercetate, chestionarele de personalitate pot 
fi clasificate astfel (Roşca, 1972): | 

e chestionare de adaptare, numite uneori şi metode de autoevaluare 

(self rating sau self report methods), deoarece subiectul dă informaţii 

asupra propriei conduite, a propriilor trăiri, care ar fi indicatoare pentru 

adaptarea sau pentru sănătatea sa psihică; se mai numesc şi inventare 

de personalitate; 

e chestionare de interese; 

e chestionare de atitudini. 

După întinderea ariei aspectelor vizate, chestionarele ri personalitate 
sunt (Roşca, 1972): 

e chestionare unifazice, care explorează componentele unei singure - 

variabile (de exemplu, chestionarul de ascendenţă-supunere al lui 

Allport); 
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a 

e chestionare multifazice, care au în vedere mai multe variabile (de 

exemplu, Chestionarul de personalitate EPQ al lui Eysenck, care 

conţine scale pentru evaluarea introversiunii-extraversiunii, neuroticis- 
mului, psihoticismului şi a dezirabilitatii sociale). 

Chestionarele de personalitate constau, în general, din afirmaţii sau 
întrebări, iar persoanei examinate i se cere să îşi manifeste acordul sau 
dezacordul faţă de ele. Acestea sunt formulate astfel încât, prin răspunsurile 
date, subiectul dă informaţii asupra stării sale de sănătate fizică sau psihică şi a 
comportamentelor sale specifice în situaţii diverse. 

În mod obişnuit, itemii unei scale care evaluează o trăsătură psihică 
conţin afirmaţii despre (Angleitner, John, Löhr, 1986): | 

a. reacţii observabile (ex. "Merg des la petreceri."), neobservabile (ex. 
"Mă gândesc mult la mine insumi.") sau simptome (ex. "Adesea simt un nod în 
gât."); 

= b. atribute, exprimate obişnuit prin adjective (ex. "Sunt un bun 

organizator."); 

„e. dorinţe şi interese (ex. "Uneori î îmi place să particip la competiţii 
sportive."); 

d. fapte biografice (ex. "In copilărie chiuleam Me de la şcoală. "); 

e. atitudini si credințe (ex. "Cred că legea trebuie respectată cu 
strictețe. "); 

f. reacțiile altora față de subiect (ex. "La petreceri sunt totdeauna în 
centrul atentiei."); 

g. comportamente neat ta ye! chiar anormale (ex. "Cineva încearcă să 
mă otraveasca."). 


Elementele componente ale unui chestionar (afirmaţii, întrebări) care — 
evaluează o aceeaşi stare sau trăsătură psihică sunt grupate într-o scală al cărei 
nume conţine denumirea aspectului măsurat (scală de anxietate, scală de 
agresivitate etc.) 

5,  Chestionarele de personalitate au la bază presupunerea că cea mai bună 
cale de a afla ceva despre un individ este de a-l întreba direct (Hammond, 1995). 
Dar, nu totdeauna răspunsurile date de subiect îl caracterizează corect. Cauza 
o poate constitui atât testul (există deficienţe în modul de formulare a itemilor 
şi, din acest motiv, subiecţii răspund la întâmplare sau nu aleg răspunsul potrivit 
pentru ei) cât şi subiectul (doreşte să facă o impresie bună sau proastă si 
răspunde în consecinţă sau are tendinţa de a da acelaşi răspuns -"da" sau "nu"- 
la toţi itemii). 

Chestionarele de personalitate sunt foarte mult utilizate datorită faptului 
că sunt uşor de administrat şi de cotat. 
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Dar, nu orice construct psihologic poate fi măsurat prin chestionare de 
personalitate. Spre exemplu, popularitatea nu poate fi evaluata in acest mod, ci 
numai urmărind reacţiile şi aprecierile celorlalţi (Ozer, Reise, 1994). 


e Testele proiective 

Ele permit cunoaşterea subiectului prin ceea ce îi este specific şi 
reprezintă o abordare a personalităţii în ansamblul ei. Această cunoaştere este 
realizată indirect. | f. 

Testele proiective sunt utilizate frecvent pentru identificarea eomponen- 
telor de personalitate legate de functionari psihice anormale, de exemplu pentru 
a examina aspecte ale persoanelor considerate a fi inconștiente (Hammond, 
1995). În acest sens, ele sunt folosite în psihiatrie şi în psihologia clinică, pentru 
precizarea diagnosticului, pentru fixarea direcţiei de desfăşurare a psihoterapiei 
şi pentru urmărirea efectelor măsurilor terapeutice. Ele oferă de asemenea 
sugestii asupra momentelor istoriei personale care trebuie să fie luate în 
considerare în cadrul convorbirilor, al observaţiei etc. - 

„Testele proiective constau din prezentarea unor stimuli nestructurati sau 
slab structurati, ambigui sau incompleti, care permit astfel obtinerea unei mari 
varietăţi de răspunsuri. Sarcina trasată prin instructia prealabilă are un caracter 
foarte general, dând libertate imaginaţiei subiectului. De exemplu, subiectului 
i se arată o serie de stimuli ambigui sub forma unor pete de cerneală şi i se cere 
să spună ceea ce îi trece prin minte sau i se prezintă câte un desgi; pe marginea 
căruia trebuie să compună o poveste. 

Metodele proiective au la bază ideea că subiectul, încercând să 
structureze materialul prezentat, să îi găsească semnificaţia sau să îl completeze, 
"proiectează" asupra stimulului propriile sale interese, aspirații, atitudini, 
conflicte sau chiar moduri stabile de gândire (Roşca, 1972). Proiectia efectuată 
de subiect este condiţionată de urmele lăsate în memoria acestuia de percepțiile 
anterioare (Petrovsky, Yaroshevsy, 1985). 

Unii autori consideră că denumirea de tehnici proiective este 
inadecvată, deoarece în timpul executării unei astfel de probe nu intră în acţiune 
mecanismul de proiecţie în sensul utilizat de psihanalişti, mecanism care s-ar 
realiza inconştient, constituind o modalitate de descărcare a tensiunii. Ei propun 
pentru acest tip de tehnici denumirile teste de apercepfie, teste de-dinamism sau — 
(este nestructurate. 

"Unul dintre avantajele\ehnicilor proiective constă in faptul că ele reduc 
rolul simulării, întrucât nu îi dau posibilitate subiectului să ghicească modul în 
care sunt interpretate răspunsurile. 

Dar, psihotehnicienii au, în general, o atitudine critică faţă de probele 
proiective, considerând că ele nu îndeplinesc condiţiile unui instrument 


a 


a 


standardizat de diagnostic. Administrarea, cotarea şi interpretarea acestor teste 
este laborioasă, cere un personal cu practică îndelungată, deci ele sunt 
costisitoare. În plus, interpretarea dată de examinator este adesea subiectivă şi 
arbitrară. | 

O altă deficiență a testelor proiective este faptul că ele operează la 
nivelul nominal de măsurare, deci furnizează o descriere a persoanei examinate 
sub forma apartenenţei la o categorie. Pentru testele proiective folosite frecvent 
există şi proceduri de cuantificare a răspunsurilor individuale, dar aplicarea lor 
este dificilă, pentru că numărul variantelor de răspuns este extrem de mare. 


e Testele obiective de personalitate 
| Aceste teste se aseamănă cu probele proiective, dar folosesc stimuli mai 
structurati. | 

Fiind teste obiective, ele urmăresc obţinerea unei concordante mari între 
cotările făcute de mai multi evaluatori. Stimulul şi reacţia provocată de el. 
trebuie să fie de aşa natură încât subiectul să nu fie tentat să falsifice răspunsul 
sau să îl distorsioneze, din dorinţa de a se prezenta într-o lumină favorabilă sau 
nefavorabilă. Pentru a realiza o asemenea cerinţă testele sunt "deghizate"; cu 
alte cuvinte, subiectul nu-şi poate da seama ce trăsătură de personalitate se 
deduce din răspunsurile sale. Din acest motiv, testele obiective de personalitate 
sunt uneori denumite feste indirecte (Roşca, 1972). 

pee) care sta la baza constructiei testelor obiective de personalitate 
este aceea că "stilul personalităţii”, "stilul comportamentului" se manifesta în 
activităţi diverse, care nu seamănă unele cu altele. Sunt folosite în teste 
asemenea activităţi simple, manipulabile în mod experimental, care pot avea o 
valoare predictivă prin modul în care sunt îndeplinite. În general, subiectului i 
se pretinde să execute o sarcină, nu să se autoevalueze, şi, din felul în care 
acesta acţionează, se deduc diverse aspecte ale personalităţii. 

De exemplu (Rosca, 1972), proba "Adjective check list" a lui H. G. 
Gough îi cere subiectului ca, dintr-o listă cu 300 de adjective aranjate în ordine 
alfabetică, să le marcheze pe cele care îl caracterizează. Psihologul are în vedere 
faptul că răspunsurile persoanei sunt conforme imaginii pe care aceasta o are 
despre sine şi nu realităţii, deci nu le interpretează direct. Dar, anumite aspecte 
ale personalităţii subiectului rezultă din modul de execuţie a sarcinii. S-a 
constatat, de pildă, că extravertitii realizează aprecieri superioare celor date de 
introvertiti, la trăsături care în realitate nu îi diferenţiază. Asemenea observaţii. 
stau la baza interpretării Stii obiective de personalitate. 


D. După modul în care variază proba. de la o il ceai la alta testele 
folosite într-o examinare psihologică se ai în: 
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e teste cu confinut fix; 

e teste cu conţinut variabil. 

În primul caz, toate persoanele examinate cu ajutorul testului parcurg 
aceiaşi. itemi. În general şi ordinea în care sunt prezentaţi itemii testului este 

aceeaşi. Atunci când testele sunt administrate colectiv, de calculator, pentru a 

se evita ca subiecţii să copieze răspunsurile unul de la altul, se poate recurge la 

schimbarea ordinii itemilor în cadrul testului, aleator sau după un algoritm 

stabilit a priori. 

Majoritatea testelor utilizate în examinările psihologice au conţinut fix. 

Din categoria testelor cu conţinut variabil fac parte testele idiografice 
şi testele adaptative. i : 

În, primul caz, testul este construit sau ales special pentru subiect. 

Testele adaptative sunt generate în momentul examinării psihologice, 
în funcție de comportarea subiectului. 

După Standards for Educational and Psychological Tests din 1985, 
testarea adaptativ este "o forma secventiala de testare in care itemii succesivi 
ai testului sunt aleşi pe baza răspunsurilor la itemii precedenţi”. La fiecare pas 
se urmăreşte să se aleagă itemii cei mai potriviţi pentru a forma un test valid şi 
fidel, care să măsoare cu precizie în zona în care se află nivelul subiectului. 

Formarea testului se realizează prin selectarea itemilor dintr-o colecție 
existentă, compusă din. itemi ale căror caracteristici sunt cunoscute. dintr-o 
testare anterioară. Pe parcursul examinării psihologice testul se adaptează la | 
nivelul de aptitudini sau de cunoştinţe al subiectului, realizând o măsurare cât 
mai precisă. Evident, asemenea teste nu se pot administra prin metoda creion- . 
hârtie, ci doar cu ajutorul unor dispozitive speciale sau al calculatorului 
electronic. 

Testele adaptative computerizate sunt construite, în general, aplicând 
teoria răspunsului la itemi. Selecţia itemului administrat la fiecare pas se face 
utilizând funcţiile de informaţie ale itemilor, astfel încât testul să furnizeze cât 
mai multă informaţie despre cel examinat (Stocking, 1987). Asemenea teste sunt 
administrate de calculator, conform următorului algoritm ((Weiss, Vale, 1987; 
Schoonman, 1989; Waller, Reise, 1989): 


(1) Se alege un nivel de pornire pentru caracteristica măsurată de test. Acesta 
poate fi egal cu nivelul mediu în populaţia din care face parte subiectul. 
(2) La fiecare pas al algoritmului: 
e Se alege un item din baza de date. 
e Se administrează itemul şi se preia răspunsul subiectului. 
e Se estimează nivelul variabilei măsurate de test, în funcţie de 
răspunsurile date de subiect până în momentul respectiv. 
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e Se verifică dacă sunt îndeplinite condiţiile de oprire a testării; în caz 
afirmativ se trece la pasul 3, iar în caz negativ se reia de la pasul 2. 
Testarea se termină de obicei când a fost administrat numărul de itemi 
fixat, când s-a epuizat timpul de testare, când intervalul de încredere 
calculat pentru variabila măsurată de test are lungimea mai mică decât 
o valoare fixată sau când acest interval nu mai include pragul de 
admisibilitate fixat. 
“ (3) Se comunică subiectului nivelul determinat de test. 

Algoritmul prezentat se referă la cazul când toţi itemii testului măsoară 
o aceeaşi caracteristică. Dar, în teoria răspunsului la itemi au fost dezvoltați 
algoritmi care permit evaluarea unei persoane în privinţa mai multor variabile 
psihice. 
La început, prin teste adaptative se evaluau doar aptitudini şi cunoştinţe. 
Acum se construiesc asemenea teste şi pentru măsurarea unor variabile non- 
cognitive, cum sunt atitudinile. | 


4.2. CLASIFICARI ÎN FUNCŢIE DE MODUL DE. 
ADMINISTRARE A TESTULUI 


A. După numărul persoanelor care pot fi examinate simultan, testele pot fi: 

e individuale; 

e colective sau de grup. 

Examenul psihologic individual este AD deat neeconomic, subiecţii 
fiind testati unul câte unul, ceea ce necesită mult timp.. Testarea colectivă 
presupune examinarea simultană a mai multor subiecţi. 

Această clasificare nu este piecisă, întrucât unele teste de grup pot fi 
aplicate şi în mod individual (de exemplu, testul Raven). Situaţia inversă este 
imposibilă, mai ales în cazul testelor de performanţă (Roşca, 1972). 

Ambele moduri de examinare prezintă o serie de avantaje, dar şi limite. 
Examenul psihologic individual îi permite psihologului să stabilească un contact 
mai bun cu subiectul, să ajungă mai repede la cooperare cu acesta. Totuşi, 
decizia psihologului este mai încărcată de subiectivitate, iar examenul 
psihologic individual este mai puţin stândardizat decât cel colectiv. În schimb, 
unele stări particulare ale subiecţilor, care pot denatura rezultatele testării, cum 
sunt oboseala, anxietatea, boala etc., sunt mai greu de detectat în condiţiile 
examenului colectiv. 

Testarea individuală i se potriveşte mai bine psihologului clinician şi 
celui de consiliere în anumite activităţi de orientare şcolară şi profesională. 
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Testarea colectiva ‘este preferată în selecţia profesională, când se operează cu 
grupuri mari de subiecţi, şi mai ales în examinările de tip screening. 


B. După fimpul de execuţie a sarcinii impuse, testele de aptitudini şi cele de 
cunoştinţe pot fi: 
e teste de viteză (speed tests); 
e teste de randament (power tests): 
e cu limită de timp; 
e cu timp de lucru nelimitat. 


> Testele de viteză contin itemi la care orice persoană din categoria celor 
cărora le este destinată proba poate să răspundă cu uşurinţă corect, dar care 
trebuie rezolvati rapid. De exemplu, trebuie barate numere sau figuri sau trebuie 
identificate figurile identice. Ele sunt administrate cu limită de timp, fixată astfel 
încât nici o persoană să nu poată rezolva integral testul. Performanța unui 
subiect este dată de numărul de itemi la care a răspuns. Aceste teste au la bază 
presupunerea că între viteza de lucru şi gradul de dezvoltare a caracteristicii 
măsurate de test există o asociere pozitivă. 

Testele de randament conţin itemi de dificultăţi diferite, adesea aşezaţi 
în ordinea crescătoare a dificultății. Timpul de rezolvare a unui asemenea test 
nu este limitat sau este suficient de generos pentru a permite parcurgerea 
integrală a testului de către toate persoanele, iar performanţa unui subiect este 
indicată de numărul itemilor rezolvati corect. 

Probele utilizate cel mai des sunt combinaţii ale celor două tipuri de 
teste. Ele conţin itemi de dificultăţi diferite şi sunt administrate cu limită de 
timp. Dacă timpul de lucru este atât de lung încât toate persoanele examinate au 
posibilitatea să rezolve toţi itemii la care cunosc răspunsul, proba se comportă 
ca un test de randament. Dacă timpul de lucru este prea scurt şi subiecţii nu au 
posibilitatea să rezolve toţi itemii la care ştiu răspunde, proba se comportă ca un 
test de viteză (Corsini, 1994). 

Guilford (1965) apreciază că un test care a fost parcurs integral de cel 
putin 75% dintre cei examinati poate fi considerat drept test de randament. 

| Atât testele de viteză, cât şi cele de randament sunt astfel construite 
încât să nu permită realizarea unui scor maxim (egal cu numărul itemilor 
testului). Acest lucru este necesar în vederea obţinerii unei imagini cât mai clare 
despre persoana testată, despre nivelul unei anumite aptitudini sau deprinderi 
a acesteia. Totodată, apare astfel posibilitatea unei ierarhizări mai precise a 
subiecţilor. În practică, distincţia între testele de viteză şi cele de randament este 
„ numai una de grad, cele mai multe teste depinzând de ambii factori în proporţii 
variabile (Cascio, 1991). 
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4.3. CLASIFICARI ÎN FUNCŢIE DE MODUL DE COTARE A 
TESTULUI ŞI DE INTERPRETARE A SCORURILOR 


A. După modul je stabilire a cotei la test, se poate vorbi despre: 

© teste obiective; 

© teste subiective. 

Un test-obiectiv este cel al cărui: scor se calculează urmând o regulă 
prestabilită, simplă, care cere o judecată redusă (English, English, 1970). De. 
exemplu, se compară setul de răspunsuri date de subiect cu un set de răspunsuri 
"fixat şi scorul'subiectului la test este dat de numărul de răspunsuri care coincid. 
“Termenul- "Obiectiv" . se referă | numai la modul în care se: face cotarea 
i răspunsurilor la test. 

E În cazul testelor « obiective, comparativ cu cele subiective, persoanele 
examinate: AT 

a. efectuează o sarcină ‘complet structurată (eles nu pot să definească sau’ 
'să organizeze ‘problema de'care se ocupă); 

b. selectează un număr fixat de răspunsuri dintr-un 1 număr fixat de 
posibilităţi de răspuns; 

ge răspund la un număr mare de’ itemi; 

d. primesc un scor la test calculat după 9) N stabilită aprior ic 

(Thorndike; Hagen, 1961). 
Pentru testele obiective ‘scorul poate “fi calculat de’ un operator (nu 
neapărat de psiholog)'sau cu ajutorul unei masini de cotare ori prin scanare si 
cotare automată folosind calculatorul electronic. 

Spre deosebire de testele obiective, testele subiective permit ca mai 
mulți evaluatori să coteze foarte diferit răspunsurile aceleiaşi persoane. Din 
‘acest motiv astfel de teste sunt utilizate cu precădere de către psihologii 
clinicieni şi în unele cabinete de consiliere, mai puţin în mediul industrial. 

Din categoria Saylor SUR LINE fac Bad testele HE ap | 


B. După modul î în ‘care se interpretează scorurile testelor, se poate vorbi 
despre: 
© teste normative; 
` @ teste centrate pe criteriu; 
„9 teste idiografi ice; 
0 teste ipsative. 


© Testele normative (norm-referenced tests) interpretează un scor 
individual prin comparație cu scorurile venge la acelaşi test de uh eşantion 
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reprezentativ de persoane. Se folosesc clasele etalonului (cuartile, decile, centile 
ori clase normalizate) sau valorile statistice (media şi abaterea standard) ale 
scorurilor în eşantionul reprezentativ. Cu ajutorul lor, pentru fiecare subiect se 
determină clasa din care face parte scorul obţinut sau se calculează cota 
transformată (cota z, cota T etc.). ` 

Adesea, pentru un test se formează eşantioane reprezentative de 
persoane după mai multe criterii, de exemplu după vârstă, după profesie, după 
nivelul de şcolarizare etc. În acest caz, scorurile unui subiect pot fi.comparate 
cu mai multe eşantioane de persoane, ceea ce permite. O oaea mai 
nuanțată. ` 


e Testele buna pe criteriu Ce referenced tests) sunt probe 
“construite intenţionat pentru a furniza scoruri care să fie interpretabile direct, în 
termenii standardelor specificate pentru Perrorinicn ia respectiva sy L. dis şi 
A. J. Nitko, după Crehan, 1974). | 

Ele folosesc, pentru interpretarea scorurilor, un criteriu de performanță, 
ales înainte de utilizarea testului. Pe baza acestui criteriu se stabileşte un "nivel 
acceptabil de performanţă" (Guilbert, 1987), cu care se compară scorul fiecărui 
individ. Rezultatul comparatiei se exprimă de obicei dihotomic: subiectul 
îndeplineşte cerinţele criteriului (a piu nivelul acceptabil de performanţă) 
sau nu le îndeplineşte. 

Uneori, în urma analizei logice şi psihologice a sarcinilor i impuse de 
test, se definesc mai multe clase de sarcini. Rezultatul obţinut de o persoană la 
test este comparat cu cerinţele fixate pentru fiecare clasă şi evaluarea subiectului 
constă în determinarea clasei de sarcini care îi este accesibilă REAT 
Yaroshevsy, 1985). 

Utilizarea testelor centrate pe criteriu pentru evaluarea elevilor are la 
bază ideea că prima preocupare a şcolii elementare nu este competitivă sau 
selectivă, ci formativă. Pentru a-l ajuta pe elev este mult mai puţin important să 
îi spui ce loc ocupă el în raport cu ceilalţi, conform cunoştinţelor sale, decât să 

îi arăţi cât de bogat este bagajul cunoştinţelor sale, cât de aproape se află de 
obiectivul urmărit de procesul de învăţământ (de Landsheere, 1975). 

De exemplu, în cazul unui test de aritmetică format din 10 exerciţii de 
adunare, administrat la sfârşitul clasei întâi, se poate stabili drept nivel accepta- 
bil de performanţă pentru promovarea clasei rezolvarea corectă a 6 exerciţii. 

În scopul evitării confuziilor, termenul “criteriu” fiind folosit în 
evaluarea psihologică pentru a desemna variabila prezisă (şi corespunzător 
acestei acceptiuni se vorbeşte despre validitatea relativă la criteriu), American 
Psychological Association, American Educational Research Association şi 
National Council on Measurement au propus înlocuirea denumirii de "test . 
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centrat pe criteriu" (criterion-referenced test) cu cea de "test centrat pe conținut" 
(content-referenced test) sau "test centrat pe domeniu" (domain-referenced test) 
' (Silva, 1993). In literatura de specialitate, pentru acest tip de teste se mai 
| foloseşte denumirea de "test centrat pe obiective" (de Landsheere, 1975). 

Întrucât testele interpretate prin referire la criterii furnizează de obicei 
un scor numeric, ele pot fi utilizate şi ca teste normative. 


e Testele idiografice se utilizează în situaţiile în care nu interesează 
compararea scorului unei persoane, la un chestionar, cu un criteriu sau cu 
„rezultatele unui grup de persoane, ci evoluţia în timp a scorului său (de 
exemplu, schimbările intervenite pe parcursul unui program psihoterapeutic). 
În asemenea cazuri, persoana completează o aceeaşi formă a chestionarului în 
mai multe ocazii şi se urmăresc modificările apărute. Întrebările adresate unei 
persoane pot fi diferite de cele adresate alteia. Această abordare a testului se 
numeşte idiografică, deoarece se ocupă de un individ izolat, folosind un 
instrument construit numai pentru el. 

Testarea idiografică are următoarele trei caracteristici (Silva, 1993): 

a. Procesul de evaluare şi instrumentul corespunzător sunt alese sau 
dezvoltate pentru fiecare individ. 

b. Variabilele studiate provin de la subiect şi din mediul său, ele nu sunt 
impuse din afară. Se ia în considerare percepţia persoanei evaluate. 

c. Evaluarea se ocupă cu descoperirea şi explorarea patternului de 
variabile care este tipic pentru fiecare persoană şi unic pentru aceasta. 

Abordarea idiografică nu permite compararea între subiecţi, dar este 
utilă pentru cercetarea proceselor dinamice care au loc în indivizi. 


e Testele ipsative sunt cele la care interpretarea răspunsurilor date de 
un individ se face prin compararea între ele a scorurilor obţinute de acesta la 
scalele sau la itemii testului (Corsini, 1994). De exemplu, testul Edwards 
Personal Performance Schedule măsoară 15 trebuinte. Prin compararea 
scorurilor realizate de un subiect la scalele probei se poate constata, de pildă, că- 
pentru acesta nevoia de realizare este mai puternică decât nevoia de hrană. 

În general, testele ipsative îi pretind subiectului să aloce o resursă 
proprie limitată (timp, bani etc.) mai multor domenii. Prin acest procedeu, 
atribuirea unei valori mari pentru un aspect scade automat valorile altor aspecte. 

De exemplu, pentru studierea motivatiei sunt enumerate o serie de 
activităţi; persoana examinată trebuie să indice cât timp îi dedică fiecăreia, în 
mod obişnuit, într-o lună. 
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CAPITOLUL 5 
CONSTRUIREA SI COTAREA ITEMILOR TESTELOR 
PSIHOLOGICE 


5.1. TIPURI DE ITEMI ÎN TESTELE PSIHOLOGICE 


Literatura de specialitate descrie şase tipuri de itemi de test utilizaţi 
frecvent în examinările psihologice. De obicei, aceştia sunt grupaţi în două 
categorii: | a 
A - itemi cu răspunsuri închise - care solicită selectarea unuia sau a 
mai multor răspunsuri dintr-o listă de răspunsuri propuse : 

e itemi dihotomici; 

e itemi cu răspunsuri la alegere (cu alegere multiplă); 

e itemi de tip asociere; Mea: 
B - itemi cu răspunsuri deschise (libere) - care pretind formularea 
unui răspuns folosind vocabularul propriu: 

| e itemi cu formulări lacunare; 
e itemi cu răspunsuri scurte; 
e itemi-eseu. 
Îi vom descrie pe scurt. 


Itemii dihotomici pun în faţa subiectului fie o propoziţie - afirmaţie 
despre care acesta trebuie să spună dacă este "adevărată" ori "falsă" (de 
exemplu, itemii Inventarului Psihologic California), fie o întrebare directă, la 
care trebuie să răspundă prin "da" sau "nu" (de exemplu, itemii Chestionarului 
de personalitate Eysenck). Este vorba despre itemi cu conţinut dihotomic, cu 
numai două alegeri plauzibile. ' 


Exemplu. 
Faceţi zilnic gimnastică de înviorare? Răspundeţi prin "da" sau "nu". 

Itemii dihotomici sunt uşor de elaborat, sunt cotati obiectiv şi se pot 
introduce în testele administrate cu ajutorul calculatorului. Răspunsurile la 
aceşti itemi pot fi prelucrate statistic fără nici o dificultate. Ca dezavantaj major 
este faptul că şansa de a ghici răspunsul corect, în cazul itemilor din testele de 
eficienţă (de aptitudini, de cunoştinţe) este mare, de 50%. 

Identificarea răspunsului corect la itemii de tip "adevarat"/ "fals", în 
testele de cunoştinţe, este facilitată de multe ori de folosirea specificatorilor: 
cuvinte ca "totdeauna", "pretutindeni", "niciodată" sau "numai" sugerează că 
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răspunsul corect este "fals", in timp ce cuvinte ca "adesea", "uneori" sau 
"obişnuit" conduc spre răspunsul "adevărat" (Aiken, 1994). 

A. L. Edwards (Gregory, 1992) susţine că răspunsurile date de AV i 
la itemi de acest fel, în chestionarele de personalitate, reflectă mai mult 
dezirabilitatea socială decât trăsătura de personalitate. Pentru a se evita aceasta, 
se pot utiliza itemi cu alegere forțată, la care subiectul să fie obligat să aleagă un 
răspuns din două propuse, ambele având acelaşi grad de dezirabilitate socială. 


Exemplu. 

În vacanțe imi petrec timpul mai ales: 
a. în faţa televizorului; 
b. făcând sport. 

AMeeen răspunsul. care vi se potriveşte. 


Pentru a nu verifica doar memor area unor cunoştinţe, ci şi înţelegerea - 
“lor, itemii dihotomici pot întreba dacă: 
e un eveniment este cauză (sau efect) al altuia; 
e un obiect, un eveniment sau o condiţie face parte dintr-o anumită 
categorie; 
e două evenimente pot avea pa simultan. 


Itemii cu răspunsuri la alegere „tan o întrebare şi o lista’ de 
răspunsuri propuse sau o frază incompletă şi o listă de completări posibile. 
Subiectului i se cere să selecteze din listă răspunsurile sau completările care i se 
potrivesc (în cazul testelor de personalitate) sau pe care le consideră corecte (în 
cazul testelor de eficienţă). Aşa sunt, de exemplu, itemii Chestionarului 16PF 
al lui Cattell sau cei din testul Matrici Progresive Raven. 

„Alteori, itemul are forma unui scenariu complex care poate conţine 
câteva probleme, la care trebuie să se dea mai multe răspunsuri prin elegiae 
celor corecte dintr-o mulțime de topna propuse. 


Exemplu. 

Aurel, Barbu, Călin şi Dan au sait la un concurs de fugă. După 
stabilirea clasamentului, s-au constatat următoarele: 
e Dan nu a ocupat nici primul, nici ultimul loc. 

e Călin s-a clasat în urma lui Aurel. — 
e Barbu a obţinut un timp mai bun decât Dan. 
e Între Aurel şi Barbu s-a clasat o altă persoană. 
1. Cine s-a clasat pe locul al doilea? 
2. Dar pe ultimul? 
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Răspundeţi la fiecare întrebare cu litera aflată în fata numelui persoanei, 
în lista următoare: 
"a. Aurel; 
b. Barbu; 
c. Călin; 
d. Dan. : Răspunsuri: j6 sunt ot 


„Sub forma de itemi cu alegere multipla, pot fi WE Va a întrebări 
complexe. Aiken (1994) propune ca prin itemi de această formă să li se ceară 
subiecţilor să efectueze.urmatoarele sarcinii, ..: 


A. să claseze o persoană, un obiect sau o condiţie. în una din categoriile 
prezentate în lista de răspunsuri propuse; 
Exemplu. 

Metoda formelor pi ALR se utilizează în SERE 

„a, validității predictive;.. 

b. validității concurente; 

c. fidelității; ; 

d. puterii de discriminare. 


B. să decidă care este consecința corectă a. unuia sau: a mai multor 
evenimente prezentate în trunchiul itemului; 
Exemplu. 

Dacă se a rie E un item al u unui test cu un alt item, care are aceeaşi 
dispersie a scorurilor ca şi primul, dar corelează mai puternic Senet acesta cu 
scorul total al testului, atunci fidelitatea testului: 

a. va scădea; 
b. va creşte; 
-c va rămâne neschimbată; . 
d. se va schimba, dar nu se poate preciza « cum., 


_ C. să utilizeze si sau mai multe condiţii, prezentate în trunchiul 
itemului, pentru a trage o concluzie; a | 
Exemplu. - 

Dacă unui test format din 20 de itemi naish, care are E oboi et de 
fidelitate egal cu 0.6, ise adaugă 5 itemi paraleli, ce valoare va avea coeficientul 
de fidelitate al noului test? 

„a. 0.45; 
ep, 0.65; 
ca SE 
d. nici unul dintre aceştia. 
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D. să decidă dacă dintre două afirmaţii cuprinse în trunchiul itemului 
este adevărată numai una sau ambele sunt adevărate sau ambele sunt false; 
Exemplu. 

Se dau următoarele afirmaţii: 

(1) Coeficientul p, serveşte la calculul coeficientului de fidelitate prin metoda 
formelor echivalente; 

(2) Coeficentul p se calculează numai ‘pent teste formate din itemi 
‘dihotomici. 

Care este valoarea de adevar a acestor afirmaţii? 

a. ambele sunt adevărate; 

b. este adevărată numai prima; 

c. este adevărată numai a doua; 

d. ambele sunt false. 


E. să determine o ppaune care nu isi are locul printre celelalte; 
Exemplu. 
Care dintre următorii coeficienți nu face parte din aceeaşi categorie cu ceilalți: 


c. wal lui Cronbach; 
d. A; al lui Gutman; 
e, coeficientul lui Spearman-Brown. 


F. să determine relaţia dintre două noțiuni (1 şi 2) şi să identifice 
noţiunea, din lista de răspunsuri propuse, care este legată de noţiunea 3, aşa cum 
sunt legate între ele noţiunile 1 şi 2. 

Exemplu. 
Numărul itemilor paraleli din test şi coeficientul lui Spearman-Brown 
sunt la fel ca şi numărul scorurilor posibile ale testului şi: 

a. dificultatea testului; 

b. puterea de discriminare a testului; 

c. validitatea testului; 

d. fidelitatea test-retest. 


Itemii cu răspunsuri la alegere sunt foarte frecvent utilizaţi în testele de 
cunoştinţe administrate creion-hârtie sau cu ajutorul calculatorului. Sunt cotati 
obiectiv. Probabilitatea de ghicire a răspunsului corect este, în general, mai mică 
decât în cazul itemilor dihotomici, ceea ce constituie un avantaj. Răspunsurile 
la aceşti itemi se pretează prelucrărilor statistice. 
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Ca dezavantaj, amintim consumul mare de timp necesar elaborării unor 
itemi în care răspunsurile propuse să fie toate la fel de atractive pentru subiecţii 
care nu cunosc răspunsul corect. 


| Itemii de tip asociere constau din două liste de elemente şi o regulă de 
asociere a câte două elemente, unul dintr-o listă şi celălalt din a doua. 
„ Subiectuluivi se cere să alcătuiască o listă-răspuns, prin formarea de perechi. 
Obişnuit, itemii discutati se prezinta ca o listă de cuvinte care trebuie alocate 
unei alte liste, care conţine definiţii. 
Exemplu. A agi 

Pentru fiecare parametru al funcției caracteristice a unui item indicaţi 
denumirea sa: 


Parametru Denumire 
a „1. puterea de discriminare 
b> 2. parametru de ghicire 
c 3. dificultatea itemului 


4. fidelitatea itemului 


Este recomandabil ca listele să nu conțină acelaşi număr de elemente. 

Itemii de tip asociere sunt cotati obiectiv. Ei pot fi introdusi în testele 
administrate cu ajutorul calculatorului. | 

O deficiență a acestor itemi constă în faptul că, dacă fiecare element al 
unei liste poate face parte dintr-o singură pereche, atunci răspunsurile date de 
o persoană nu sunt independente între ele: introducerea unui element într-o 
pereche nu mai dă posibilitatea utilizării sale şi în altă pereche. Prin urmare, 
formarea unei perechi greşite va avea drept consecinţă apariţia altor perechi 
eronate. Se poate evita acest fapt permiţând formarea mai multor perechi cu 
elementele unei liste. 


Itemii cu formulări lacunare sunt de format deschis, adică pretind 
construirea răspunsului şi nu alegerea acestuia dintr-o listă. Ei adresează o 
întrebare la care se cere să se formuleze un răspuns sau prezintă un text 
conţinând spaţii libere, care trebuiesc completate. | 
Exemple. 

1. Care este valoarea minimă a coeficientului de fidelitate al unui test 
psihologic? | 

2. Proprietatea unui test de a-şi îndeplini funcţia pentru care a fost construit se 
numeşte ... 

Completaţi denumirea. 
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-Ttemii cu formulari dacupene pot fi introduşi, în testele administrate de 
(de ante toate sinonimele Mispunsului aşteptat). 

Principalul dezavantaj prezentat de aceşti itemi este faptul că nu se 
poate asigura totdeauna obiectivitatea cotării: uneori sunt formulate răspunsuri 
diferite de cele SRRA: iar cotarea acestora este stabilită de evaluator. 


Kenii cu răspunsuri. i ice il cer persoanei estate sa aii un 
răspuns clar pe cel mult o pagină. lais wy ies sl 
Acesti itemi sunt recomandati petitia a i D e în testele: de 
cunoştinţe, când se urmăreşte în ce măsură subiectul a înţeles materialul învăţat, 
este capabil să explice, să analizeze sau să sintetizeze. De asemenea, ei sunt utili 
atunci când se doreşte evaluarea creat eis 
Exemplu. | i 
| Care dintre formele ce validate este mai importanta in cazul unui test 
utilizat in saa: profesionala ?: POUEUTSD IA pipa 


Avante major al itemilor de acest tid este xj hak ca permit roen 
originalității răspunsului.. . SDE 

„Principalul dezavantaj îl constituie: ceai obiectivititiia in Gait. Scorul 
acordat unui asemenea item este influențat de efectul de halo, de oboseala: celui 
care face notarea, de calitatea redactării etc. 


Itemii eine ip pent, ca cu Îl cainabadeschis a căror lungime 
depăşeşte o pagină. iii i | 
Exemplu.. . abu: x Py 
Sunteti mii: la o TORP care vrea să angajeze un programator. Vi. se 
cere să realizaţi examinarea psihologică în acest scop. Cum procedaţi ? .. 


„Aceşti itemi: sunt recomandaţi atunci când. interesează. ie a 
subiectului dea formula un răspuns original... 4% 
| peas od EA permit să se măsoare. capacitatea persoanelor de a organiza, de a 

felata sau/ şi de a comunica, adică ceea ce itemii cu răspuns închis nu pot 
aa, Ad 
„Laun asemenea item, într-un test de cunoştinţe, subiecții nu pot ghici 
eA corect, ceea ce constituie un avantaj, dar pot evita să discute despre: 
ceea ce cunosc mai putin, dezvoltând subiectele pe care le stăpânesc. i 
Itemii eseu sunt uşor de construit, dar consumă mult kupp pentru: 
evaluarea Pema şi nu pot fi cotati obiectiv. i 
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Daca nu pot fi inlocuiti cu itemi cu raspunsuri inchise, pentru a se 
micgora subiectivitatea cotării, itemii de tip eseu vor fi formulaţi astfel încât 
sarcina subiecţilor să fie bine precizată: li se va cere să "explice" şi să 

"stabilească deosebiri”, nu să "discute". 


În chestionarele de autoevaluare apar câteva tipuri de itemi 
asemănătoare ca formă itemilor cu răspunsuri la alegere. Aşa sunt: , 
e scalele Likert; 
e itemii cu alegere forţată; . 
e scalele cu ancore comportamentale. 
Îi vom descrie în continuare. 


O scală Likert constă dintr-o afi irmatie însoţită de mai multe răspunsuri 
propuse (de obicei 3-7) care reprezintă. grade diferite de. acord cu, ideea 
exprimată în enunţ. De exemplu, asemenea răspunsuri pot fi: 

5 - îmi place totdeauna; 

4 - îmi place adesea; 

3 - uneori îmi place, alteori nu; 

„2 - adesea nu-mi place; 

] - niciodată nu-mi place. 

Subiectul trebuie să indice răspunsul care i se potriveşte cel mai Hil POR 

O scala Likert se comportă ca un item. Ea este cotată independent de 
răspunsurile date la alte scale. De obicei. cota este numărul de ordine al 
răspunsului. | i 

Avantajul prezentat de scalele Likert față de itemii dihotomici constă 
în faptul că ele permit o mai mare varietate de răspunsuri şi în acest fel se 
diminuează riscul de a. obţine de la majoritatea persoanelor acelaşi răspuns, cel 
care corespunde dezia aL sociale. o 


Un item cu alegere forage folii două, trei sau mai multe 
caracteristici, activităţi ori alte descrieri care au legătură cu ceea ce măsoară 
testul, toate la fel de atractive. Subiectul trebuie să aleagă ceea ce îi place cel 
mai mult şi ceea ce îi place cel mai puţin sau ceea ce consideră că este cel mai 
descriptiv şi cel mai puţin descriptiv, De exemplu, un asemenea item poate cere 
să se baa activitatea cea mai plăcută dintre "ascultarea unui concert de muzică 
uşoară" şi "vizionarea unui film”. 

Itemii cu alegere forţată corespund situaţiilor. day viata zilnică, întrucât 
în mod obişnuit nu se întâmplă ca mai multe terur să fie la fel de atractive î în 
acelaşi timp. 
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O scală de autoevaluare cu ancore comportamentale se referă la o 
dimensiune a constructului măsurat de test. Se prezintă sub forma unui segment 
gradat alături de care sunt fixate o serie de ancore care reflectă niveluri diferite 
de dezvoltare a dimensiunii respective. Fiecare ancoră conţine o descriere a unui 
comportament, apreciat ca fiind caracteristic unei persoane care se află la nivelul 
aflat în dreptul ancorei. 

Subiectul trebuie să marcheze pe segmentul scalei gradatia care crede 
că i se potriveşte cel mai mult. 

Numărul de gradatii variază de obicei între 4 şi 8. Numărul de ancore 

nu trebuie să fie egal cu numărul de .gradaţii. Ele nu sunt repartizate echidistant 
de-a lungul segmentului ci sunt plasate în dreptul cyp la care se potrivesc. 
Exemplu. 

Scala "Controlul termenelor" din Chestionarul de Percepfie a Timpului 
(Landy, Rastegary, Thayer şi Colvin, 1991), conţine următoarele ancore, 
ordonate de la nivelul cel mai scăzut de manifestare a acestei dimensiuni (cotat . 
cu 1) spre nivelul cel mai ridicat (cotat cu 7): 

e Adesea solicit derogări de la termenele de execuţie sau de la diferite sarcini. 
e Rar îmi stabilesc termene de execuţie. 

e Prefer să mă concentrez asupra calităţii muncii mele şi nu asupra efectuării ei 
“la timp sau după un grafic/termen scadent. 

e Îmi stabilesc termene de execuţie pentru mine însumi, doar dacă este necesar. 
e Uneori sunt preocupat de termenele de execuţie ale unei activităţi. 

e Sunt totdeauna pregătit pentru orice eveniment. i 

e Dacă nu îmi este fixat un termen de execuție pentru o sarcină, îl stabilesc eu 
însumi. 

e Îmi achit notele de plată (taxele de lumină, telefonul etc. ) cât pot de repede. 

Întrucât o asemenea scală este cotată independent de altele, ea se 
comportă ca un item. Dar, pentru că scorul său nu se adună la scorurile altora 
şi este interpretat separat, ea este considerată ca fiind o scală compusă dintr-un 
singur item. 


5.2. SUGESTII PENTRU SCRIEREA ITEMILOR 


Indiferent de tipul itemului, la redactarea sa este bine să se aibă în 
vedere următoarele reguli (după Ebel, 1955; de Landsheere, 1975; Shrock, 
Coscarelli, 1989): 

a. Formularea itemului să fie adecvată e de maturitate şi de 
pregătire al persoanelor cărora le este destinat testul. 
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b. Ideile sa fie exprimate clar, prin cuvintele cele mai potrivite, cu un 
sens precis. Se vor evita frazele lungi şi asocierile de cuvinte care fac dificilă 
înţelegerea întrebării. 

c. Să nu se introducă în item informaţii neesentiale : sau cuvinte 
nefunctionale (care nu contribuie la fundamentarea alegerii răspunsului). 

d. Să fie incluse în întrebare toate datele necesare pentru a permite 
raţionamentul pe baza căruia se alege răspunsul. Nu se vor considera implicite 
anumite informaţii. S-ar putea ca nu toţi subiecţii să le cunoască sau să le 
presupună. 

e. Să se evite formulările care sugerează răspunsul. 

f. Structura textului întrebării să fie cât mai simplă. În general este 
preferabil ca itemul să înceapă cu întrebarea, iar răspunsurile pippuse şi 
explicaţiile să fie aşezate la urmă. 

g. Să se evite utilizarea, în textul întrebării, a negatiilor (cum sunt "nu", 
"nici", "niciodată"), în special a negatiilor duble. Dacă, totuşi, negatiile sunt 

„necesare, ele vor fi scrise cu alte caractere (de exemplu, cu majuscule) sau vor 
fi subliniate pentru a atrage atenţia asupra LIN 


Următoarele sugestii se referă la itemii testelor de eficienţă. 


Itemii de tipul "adevarat-fals" trebuie să se bazeze numai pe 
declaraţii care sunt absolut şi fără ambiguitate adevărate sau false, adică a căror | 
valoare de adevăr este apreciată la fel de către orice persoană care are 
aptitudinea, deprinderea sau cunoştinţele necesare pentru a da un răspuns corect, 

Dacă declaraţiile sunt numai aproximativ adevărate, atunci în faţa celui 
examinat se ridică o problemă dificilă: el trebuie să ghicească ce toleranţă este 
admisă la aprecierea corectitudinii răspunsului. De exemplu, Q aceeaşi întrebare 
de tip "adevarat-fals" poate fi formulată în urmatoarele trei moduri: 

1. Valoarea lui 7 este 3,14. 

2. Valoarea lui iz este 3,1416. 

3. Valoarea lui cu 4 zecimale este 3,1416. 

Primele două variante sunt doar parţial adevărate. Ele vor fi considerate 
false nu numai de către subiecţii care nu cunosc valoarea numarului 7, ci şi de 
cei foarte bine informaţi, care ştiu că 3.14 şi, respectiv, 3.1416 sunt numai 
aproximatii ale acestuia. 

În test, itemii pentru care răspunsul corect este "fals" să fie aproximativ 
de aceeaşi lungime şi în a eels număr ca şi itemii al căror răspuns corect este 

"adevărat", 
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Pentru întrebările cu alegere multiplă este bine să se ia în considerare 
urmă-toarele recomandări (Ebel; 1955; Shrock şi Coscarelli, 1989; Gregor 
peed 

"a. Numărul de răspunsuri propuse să fie cuprins între 3 şi 5. 

b. Răspunsurile propuse să aibă aproximativ aceeaşi lungime. 

c. Răspunsurile propuse vor fi aşezate în ordine logică. De exemplu, 
daca acestea sunt numere, ele vor fi asezate in ordine crescatoare sau 
descrescatoare. | 

d. Se va urmări ca tree propuse să nu se capu ap a şi să nu se 
includă unul pe altul. 

e. Se va evita plasarea raspunsului corect pe pescas poziție într-un 
număr mare de întrebări. 

f. Ca răspunsuri incorecte, în lista de răspunsuri propuse, se vor utiliza 
erorile pe care le fac în mod ids subiecții din categoria ci cărora li se 
adreseaza testul. d | 
g. Trunchiul itemului va conţine toate informațiile necesare asig 
alegerea răspunsului corect. 

h. Pentru simplificarea formulării, se vor include în învă aul itemului 
(care conţine fie o întrebare directă, fie o declaraţie incompletă) cuvintele care 
ar Lei repetate în fiecare răspuns, dacă acest lucru nu îngreunează inteleger rea. 

i. Se va respecta acordul gramatical între textul inclus în trunchiul 
itemului şi răspunsurile propuse. 

>- je Se va evita utilizarea unor declaraţii negative în HER itemului. 
Dacă, însă, este dificil de reformulat itemul pentru a se elimina declaraţia 
negativă, cuvântul "nu" din textul intrebarii peat subliniat sau scris cu 
majuscule. muy 

k. Expresiile "nici una dintre acestea" şi "toate acestea vor fi utilizate 
ca răspuns propus numai atunci când se poate da un răspuns absolut corect la 
întrebare. Se recomandă ca aceste formulări să fie folosite ca răspuns incorect. 

l. În acelaşi test po să agt itemi cu un număr diferit de răspunsuri 
propuse. : 


. Pentru scrierea itemilor de tip asociere sunt utile următoarele sugestii 
(Shrock, Coscarelli, 1989): Ngee a N 
a. Elementele fiecarei liste sa fie „ide între fae! să aparţină aceleiaşi 
categorii. 
b. Fiecare listă poate conţine între 5 şi 15 elemente, aranjate, dacă este 
posibil, într-o ordine logică (cronologic, crescător sau descrescător după 
“ valoarea numerică etc.). 
c. În trunchiul întrebării se va prezenta regula de formare a perechilor. 
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“d. Se va species daca un element al unei liste poate fi fi inclus intr-o 
singura pirne sau în mai multe. 
~ e. Cel putin una dintre liste va conţine si “elemente care nu pO fi fi 
“ cuprinse în nici o pereche. 


Utilizarea, în teste, a întrebarilor cu răspunsuri deschise ridică 
probleme atât în ceea ce priveşte formularea întrebărilor, cât şi la interpretarea 
şi punctarea răspunsurilor. Experienţa a dovedit că este aproape imposibil să se 
formuleze itemii astfel încât toţi cei care cunosc răspunsul : să îl exprime identic. 
Autorii de itemi au fost surprinşi de varietatea mare a răspunsur ilor corecte care 
apar la întrebări pentru care s-a prevăzut un singur răspuns. 

“Se întâmplă, uneori, ca răspunsul dat de subiecţi să fie corect, dar 
îndepărtat de intenţia autorului itemului. De exemplu, la întrebarea "Poetul G. 
Coşbuc s-a născut in..." se poate răspunde corect fie cu | 866, fie cu 
"Hordou". 

Este necesară, ideii '0 formulare atentă, care să furnizeze elemente 
iti pentru a-l conduce pe cel examinat spre răspunsul aşteptat. Astfel, în 
exemplul anterior, textul itemului ar fi trebuit completat cu unul dintre cuvintele 
aloca et sau "anul". 

“Chiar şi problemele matematice pot cauza asemenea necazuri, dacă nu 
se specifi ică precizia rezultatului cerut, forma de exprimare (printr-o fractie ori 
printr-un număr zecimal) sau unitatea de măsură. 

Este posibil ca un răspuns corect să admită mai multe sinonime. Întrucât 
aprecierea corectitudinii unui 'răspuns la o întrebare deschisă se face prin 
compararea răspunsului dat de subiect cu cel indicat de către autorul itemului 
este necesar să se prevadă toate variantele corecte posibile. A 

În cazul întrebărilor cu răspunsuri deschise trebuie să i se specifi ice 
subiectului dacă la cotare se fine seama şi de regulile ortografice şi gramaticale. 

De asemenea, trebuie să i se indice cât spaţiu are la dispoziţie pentru 
redactarea răspuristlui (număr de rânduri, pagini sau ecrane). 


5.3. CALCULUL SCORULUI UNUI ITEM 


« Calculul scorului unei persoane la un test presupune, în general, 
partar pu următorului algoritm: . 
(0) Se calculează punctajul pentru fiecare item al testului. 
(2) Se inmulteste scorul fiecărui item cu câte o pondere. 
(3) Se însumează valorile obţinute la pasul 2. 
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Întrucât valorile ponderilor depind numai de caracteristicile itemilor, ele 
„pot fi incluse în scorurile acestora. În acest caz, pasul 2.nu mai are rost. 
În literatura de specialitate (Cronbach, 1966; Fisseni, 1990; Guilford, 
1936 şi 1965; Lord, Novick, 1968; Traxler, 1955) sunt prezentate diverse 
formule de calcul al scorului itemilor. 


A. Pentru itemii din chestionarele de personalitate procedeele utilizate 

în majoritatea cazurilor sunt următoarele: 

a. Itemii dihotomici primesc un punct dacă răspunsul dene un nivel mai inalt 
“al caracteristicii măsurate de test şi zero daca indică un nivel mai scăzut. 
` b. Itemii cu alegere multiplă au asociată câte o cotă pentru fiecare răspuns 
propus. Ordinea răspunsurilor stabilită pe baza acestor cote trebuie să 
corespundă nivelurilor succesive ale variabilei măsurate de test: cota cea mai 
mare o primeşte răspunsul care este ales de ao gi cu cel mai înalt nivel al 
acestei variabile. 
c. Pentru scalele Likert, cota este egală de obicei cu numărul de ordine al 
răspunsului în şirul ordonat în care primul răspuns corespunde nivelului cel mai 
scăzut al variabilei măsurate de test. 


B. Scalele de autoevaluare comportamentală bazate pe ancore au 
cota egală cu gradatia indicată de subiect. 


C. Pentru testele de aptitudini şi testele de cunoştinţe, atunci când 
răspunsul la item este apreciat prin "corect" sau "greşit", se pot aplica diverse 
formule de calcul al scorului. Vom prezenta în continuare câteva dintre ele. 

Cea mai simplă tehnică de cotare a itemilor unui test de eficienţă, 
valabilă pentru toate tipurile de întrebări, constă în acordarea unui punct fiecărui 
răspuns corect şi zero puncte răspunsurilor greşite sau omise. În felul acesta, la 
un item care pretinde k răspunsuri (de exemplu, selectarea a ķ răspunsuri dintr-o 
lista de răspunsuri propuse sau enumerarea a k termeni etc.) se poate obţine un - 
scor cuprins între zero puncte (dacă nu s-a dat nici un răspuns corect) şi k puncte 
(dacă s-au indicat corect toate răspunsurile cerute). Deci punctajul maxim 
posibil este dat de numărul răspunsurilor corecte existente la întrebare, neavând 
nici o importanţă numărul răspunsurilor posibile. Or, cu cât sunt mai numeroase 
răspunsurile posibile, cu atât este mai dificil să se selecteze răspunsurile corecte. 
La o întrebare de tip "adevărat-fals", probabilitatea de a obţine un punct, ghicind 
răspunsul, este de 50%, in timp ce şansa de a ghici răspunsul corect din 5 
răspunsuri propuse, bine formulate -încât toate să fie plauzibile- este de 20%; 
iar probabilitatea de a ghici anul naşterii lui Mihai Eminescu, la o întrebare 
deschisă care solicită acest lucru, este mult mai mică. O soluţie pentru a evita 
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obţinerea aceluiaşi punctaj la itemi care măsoară aceeaşi caracteristică, dar care, 
datorită formei de prezentare sunt de dificultăţi diferite, ar fi să se utilizeze 
metoda de calcul al scorului expusă mai sus numai în cazul testelor alcătuite din 
itemi care au aceeaşi probabilitate de ghicire a răspunsului corect. 

Un alt dezavantaj al acestui mod de punctare constă în faptul că permite 
obţinerea scorului maxim la o întrebare cu alegere multiplă şi atunci când nu se 
cunosc răspunsurile corecte, dar se selectează toate răspunsurile propuse. În 
orice caz, sunt avantajati cei care, nefiind siguri pe cunoştinţele lor, aleg cât mai 
multe răspunsuri propuse. 

Chiar şi atunci când se specifică numărul răspunsurilor aşteptate, 
această metodă îi favorizează pe cei care încearcă să ghicească răspunsurile ori 
de câte ori nu le cunosc. — 

De exemplu, in cazul unei întrebări dintr-un test de cunoştinţe, care 
solicită selectarea a k răspunsuri din n propuse (2k < n), o persoană care nu 
cunoaşte deloc materia verificată, alegând la întâmplare k răspunsuri, are o şansă 
de- ; 


(S02. a) 


la sută să obţină cel putin un punct. (Dacă n=4 şi k=2, atunci probabilitatea de 
a ghici cel putin un răspuns corect este de 83%.) Când n < 2k, adică mai mult 
de jumătate din răspunsurile propuse sunt corecte, atunci orice alegere de k itemi 
aduce un minimum de 2k-n puncte. În asemenea situaţii, întrebarea ar trebui 
reformulată, astfel încât să ceară selectarea celorlalte n-k răspunsuri din cele n 
propuse. | | 

Metoda este utilă, însă, în cazul întrebărilor deschise, atunci când 
probabilitatea de a ghici răspunsurile corecte este scăzută. 

În cazul testelor compuse din întrebări cu alegere multiplă, dacă fiecare 
item cere selectarea unui singur răspuns din n propuse, pentru calculul scorului 
total al testului se poate utliza următoarea formulă, cunoscută sub denumirea de 
formula corectată pentru şansa succesului: 


S-=)C.- Pols 2 (5.3.2) 
n-l ; 


unde: 
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S = scorul testului; 
C = numărul itemilor la care s-a răspuns corect; 
G = numărul itemilor la care s-a răspuns greşit. _ 
Ea se bazează pe ipoteza că orice persoană care nu cunoaşte răspunsul 
“la un item îl omite sau ghiceşte la întâmplare. Dar, această presupunere este 
rareori corectă. Examinatii care au informaţii parţiale despre un item nu vor 
răspunde la întâmplare. La fel, persoanele care au informaţii greşite. În 
asemenea situaţii, răspunsurile greşite propuse la întrebare nu sunt la fel de 
atractive pentru examinat. De 
Adevărul este că persoanele diferă mult între ele în ceea ce priveşte 

modul de a proceda faţă de itemii al căror răspuns nu îl cunosc. Unele nu 
răspund, altele răspund la întâmplare. 
O proprietate a formulei corectate pentru şansa succesului este că, dacă 

pentru un item toţi examinatii ghicesc la întâmplare, atunci scorul mediu la 
întrebare este egal cu zero. Dacă, însă, persoanele testate sunt capabile să 
elimine corect y răspunsuri dintre cele n propuse şi vor alege la întâmplare 
dintre cele n-y răspunsuri rămase, atunci media scorurilor la item va fi 


ley evans 
n= TA GRES) 
n-y (n-y)(n-1) 


m 


deci mai mare decât zero. Dacă răspunsurile propuse la o întrebare nu sunt atât 
de bine formulate încât cele greşite să fie mai atractive decât răspunsul corect, 
persoanele care nu cunosc răspunsul corect, dar aleg inteligent, vor fi avantajate 
fata de cei care nu răspund. l 
Ori de câte ori o persoană poate elimina cel putin un răspuns greşit din 
cele propuse, va avea şanse să obțină un punctaj mai mare alegând la întâmplare 
unul dintre răspunsurile propuse rămase. Şi, de fapt, este normal ca un examinat 
care are informaţii parţiale despre un item să obţină un scor mai mare la test 
decât persoanele care nu au deloc cunoştinţele verificate de respectiva întrebare. 
O practică larg acceptată în administrarea, testelor este de a le spune 
examinatilor că este în dezavantajul lor să ghicească răspunsul atunci când nu 
îl cunosc, deoarece greşelile sunt penalizate la calculul scorului, dar de a-i 
încuraja să răspundă de fiecare dată când nu sunt siguri, însă pot face un 
raţionament bazat pe.informatii, asupra celui mai rezonabil raspuns. (Cronbach, 
1966). Un asemenea procedeu scade numarul omisiunilor. 
În faza analizei de itemi constructorul de test are interesul sa obţină cât mai 
multe răspunsuri, pentru a putea identifica răspunsurile propuse mai puţin 
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plauzibile, spre a le reformula sau elimina. In această situaţie, este recomandabil 
să se aplice modul de lucru descris mai sus. 

Dacă nu există omisiuni, scorurile calculate cu formula corectată pentru 
şansa succesului sunt corelate liniar cu scorurile obţinute atribuind câte un punct 
pentru fiecare răspuns corect. Îndiferent cu care dintre formule s-ar calcula 
scorurile, ordinea persoanelor examinate, stabilită pe baza scorurilor, este 
aceeaşi. | 
O metodă de calcul al scorului pentru un test compus din itemi cu 
alegere multiplă, mai generală decât formula corectată pentru şansa succesului, 
a fost propusă de Traxler (1955). Ea se poate utiliza atunci când toţi itemii 
testului propun acelaşi număr de răspunsuri, n, şi cer selectarea aceluiaşi număr 
de răspunsuri corecte, k: 

k 


SiC ie tae 5.3.4 
ng } ( ) 


unde: 
S = scorul testului; 
C = numărul de răspunsuri corecte date de subiect; 
G = numărul de răspunsuri greşite date de subiect. 
Pentru k=1 se regăseşte formula corectată pentru şansa succesului. Se poate 
obţine scorul S, dat de formula de mai sus, dacă se acordă: 

1 punct pentru fiecare răspuns corect; 
- k/(n-k) puncte pentru fiecare răspuns greşit; 

0 puncte pentru fiecare răspuns omis. 
Înseamnă că scorul la un item va fi cuprins între -k puncte (dacă se dau n-k 
răspunsuri, toate greşite) şi k puncte (dacă se dau k răspunsuri corecte). Ori de 
câte ori.nu se răspunde la un item sau se indică toate răspunsurile propuse, 
scorul va fi nul. 

Cantitatea scăzută pentru un răspuns greşit, ki(n-k), este cu atât mai 
mare, cu cât raportul Kn, adică probabilitatea unui răspuns corect, este mai 
mare. 

Avantajul acestei formule constă în faptul că permite punctarea si 
pentru itemii rezolvati partial corect. Dar, formula are şi o deficiență majoră: 
dacă se modifică o întrebare astfel încât să ceară selectarea celor n-k răspunsuri 
care in prima variantă erau considerate greșite, atunci intervalul de valori pentru 
„scor se schimbă din [-k, k] in [-(n-k), (n-k)], cu toate că, itemul măsoară acelaşi 
lucru ca şi înainte. 

Pentru remedierea deficienței semnalate, formula de mai sus ar putea 
fi modificată astfel: 
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——— (5.3.5) 


Atunci intervalul de valori pentru scorul oricărui item devine [-1, 1]. 


Itemii de tip asociere pot fi consideraţi, pentru calculul scorului, drept 
itemi cu alegere multiplă, în care numărul de răspunsuri propuse, n, este egal cu 
numărul tuturor perechilor care pot fi formate, iar numărul de răspunsuri 
corecte, k, este egal cu numărul perechilor corecte. 

De exemplu, să presupunem că întrebarea propune următoarele două 


liste: 
Al Bl 
A2 B2 


B3 

şi cere să se formeze trei perechi în care un element să fie dintr-o lista, iar 
celălalt, din a doua. Regula după care se alcătuiesc aceste perechi este formulată 
în textul întrebării. Să presupunem că sunt corecte perechile (A1,B1), (A1,B2) 
şi (A2,B1). 

Se interpretează întrebarea ca fiind un item cu alegere multiplă, care 
propune 2x3=6 răspunsuri: (A1,B1), (A2,B1), da „B2), (A2,B2), (A1,B3), 
(A2,B3). În acest caz, n=6 şi k=3. 


CAPITOLUL 6 
PRINCIPALELE TEORII ASUPRA TESTELOR 
PSIHOLOGICE 


2 


6.1. TEORIA CLASICĂ A TESTELOR 
6.1.1. Scor real, scor observat 


Se consideră două mulţimi : 

P = o mulţime de persoane; 

M = o mulţime de instrumente de măsurăi(teste sau itemi de test). 

Ambele mulţimi pot fi infinite - dar numărabile- sau pot conţine un 
număr finit de elemente; în particular, ele pot fi formate dintr-un singur element. 

Rezultatul efectuării unei măsurători cu un instrument meM asupra unei 
persoane peP se exprimă sub forma unui număr real, care se notează cu Xp ŞI 
se numeşte scor observat. Valoarea lui depinde de condiţiile particulare în care 
se face măsurarea. x,,, este doar una dintre valorile care s-ar putea obţine pentru 
instrumentul de măsură meM şi persoana peP. | 

Raţionând in acest mod, putem interpreta valoarea Xnp Ca fiind o 
realizare a unei variabile aleatoare pe care o notăm cu mp. Repartiția variabilei 
aleatoare X,,,, dată de toate scorurile observate care s-ar putea obţine prin 
efectuarea de măsurători, în diverse condiţii, folosind instrumentul m asupra 
persoanei p, cu probabilitățile corespunzătoare, nu este cunoscută. În primul 
rând, este imposibil chiar şi numai de imaginat, cu atât mai mult de realizat 
practic, toate situaţiile particulare în care ar putea fi efectuată măsurarea. Pe de 
altă parte, două scoruri observate nu sunt întotdeauna rezultatul unor 
experimente independente. O asemenea situaţie poate să apară, de exemplu, 
atunci când răspunsurile date la o administrare a unui test sunt memorate de 
subiect şi reproduse mecanic la administrările ulterioare. 


Pentru variabila aleatoare X,,, vom nota valoarea medie cu Di: 
| Zap =M (Xp) (6.1.1.1) 
Intrucât repartiția variabilei aleatoare X mp nu este cunoscută, valoarea medie Tik 
nu poate fi calculată în practică. Dar, teoretic, ea există. Vom presupune că ea 
este finită, adică ,,,<co, 

Pentru un instrument de măsură meM şi o persoană peP numărul real 
Tp Se numeşte scor real. El poate fi interpretat ca valoare unică a unei variabile 
aleatoare constante 7, np Guilford (1965) apreciază că scorul real este valoarea 
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care s-ar obţine dacă măsurarea ar fi făcută cu un instrument perfect, aplicat in 
condiţii ideale. 

Diferenţa dintre un scor po Adele Xnp» Şi scorul real 7 Tmp SE numeşte în 
| mod obişnuit eroare de măsură şi se notează Cu epp: 
Cnp = Xnp ~ Top (6.1.1.2) 

Emp poate fi considerat drept o valoare posibilă a variabilei aleatoare re Erp definită 
prin relația: w l 
Fag 9, ca a dei | AmE ETS) 
Nici Ea această arii aleatoare nu poate fi cunoscută repartiţia. Dar, din 
definiţia scorului real şi a erorii de măsură rezultă că, pentru o persoană p şi un 


instrument de măsură m, media erorilor de măsură este egală cu zero: 


M(E,,) = 0 (6.1.1.4) 
Analizând relaţia existentă între variabilele aleatoare Xj. Tnp $i Enp: 
Am bi Sm (641.15) 


se poate deduce faptul că scorurile observate la un test (x,,,) reflectă retina la 
„a două feluri de factori: 

e factori care contribuie la consistență (cate furnizează valoarea ,,,): 
caracteristicile stabile ale individului şi ale situaţiei în care se face 
măsurarea; 

e factori care contribuie la inconsisten{a (care produc valorile eo): 
caracteristici ale individului sau situaţia de examinare, care afectează 
scorurile observate, dar care nu au nimic comun cu ceea ce se încearcă 
“să se măsoare. | 


Variabilele aleatoare 4,» eit np ŞI Enp au fost construite pentru un anumit 
instrument de măsură meM şi o ) persoană pen peP. 

Să alegem acum un instrument de măsură meM şi să îl aplicăm, în 
condiţii standardizate, tuturor persoanelor din populația P. Să notăm cu A+ 
variabila aleatoare a cărei repartiție este dată de toate scorurile observate care 
s-ar putea obține în populația P, cu probabilitățile corespunzătoare. 

Vom nota cu 7, variabila aleatoare care are ca valori scorurile reale ale 
tuturor persoanelor din populaţia P şi cu E, variabila aleatoare corespunzătoare 
erorilor de măsură care se pot obţine în populaţia P. 


TEOREMA 6.1.1.1. (Lord, Novick, 1968). În populaţia P sau în orice 

subpopulatie a lui P are loc relaţia: i 
Xm = Lge + Epe : ieis (6.1.1.6) 

Observație. Dacă populația P este formată dintr-o singură persoană, P={p}, 


atunci egalitatea de mai sus devine 
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deg Ma te (6.1.1.7) 
deci se regăseşte relaţia (6.1.1.3) pe baza căreia a fost definită variabila aleatoare _ 
Em 

Din formula (6.1.1.6) se deduce că, în întreaga populație P, deosebirile 
observate între scorurile obținute de subiecți (valorile variabilei ei Ant) pfovin din 
doua surse: 

e deosebirile existente între persoane în privinţa caracteristicii tit 

` de test (valorile variabilei Te); 
e erorile de măsură (valorile variabilei Æ»). 
Vom presupune în continuare că variabila aleatoare X,» are dispersie 


finită: 
T (Xp) <% (6.1.1.8) 
Din inegalitatea (6.1.1.8) rezultă următoarele: 
O(T ns) < © | (6.1.1.9) 
M(X,,*) < o | (6.1.1.10) 
M(Tp)<oe (6.1.1.11) ` 


Pentru a elimina din discuţie cazurile banale, vom presupune că fiecare dintre 
variabilele X,+, Ze şi &» are mai multe valori (nu este constantă), ceea ce 
conduce la inegalitatile: 


P(X) > 0 eda 
O(Tms) > 0 aes) 
(Ens) > 0 | (6.1.1.14) 


TEOREMA 6.1.1.2 (Lord, Novick, 1968). 
a. Media erorilor de măsură este egală cu zero: 


M(E,,«) = 0 (6.1.1.15) 
b. Media scorurilor observate este egală cu media scorurilor reale: 

M(Xn) = M(T,,») (6.1.1.16) 
c. Scorurile reale şi erorile de măsură sunt necorelate liniar: 

XE m Im) 39 (6.1.1.17) 


d. Pentru orice valoare particulară a scorurilor reale, z,+, media erorilor de 
măsură în populația iii este egală cu zero: 
M(E W T Tm) = (6. Vl 18) 
“(Media erorilor într-o pi AR cu scor real fixat este egală cu zero.) 
e. Dacă aeM şi beM sunt două instrumente de măsură, atunci coeficientul de 
corelaţie liniară între scorurile reale ale unui instrument şi erorile de măsură ale 
celuilalt este egal cu zero: | 
O Er, T) = 0 (6.1.1.19) 
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f. Se consideră două instrumente de măsură distincte, aeM si beM. Dacă pentru 
fiecare persoană peP variabilele aleatoare X,, şi Xẹ (sau, echivalent, Eq şi Ep) 
sunt independente, atunci coeficientul de corelaţie liniară între erorile coat doua 
instrumente de măsură este egal cu zero: 

AE», Ep) = 0 j | (6.1.1.20) 


Din ERL teoremă se pot deduce următoarele consecințe: 


A. Ba orice valoare posibilă a scorurilor reale, 7, media scorurilor observate 
este egală cu T. ` 

Mel 1 De (6.1.1.21) 
Adică regresia scorului aera faţă de scorul real este o dreaptă care trece prin 
origine şi are panta egală cu unu. i 


B. Dispersia scorului observat este egală cu suma dispersiei scorului real si a 
„dispersiei erorii: ; | 
T (Xn) = OTs) + (Ene) : (6.1.1.22) 


C. Pătratul coeficientului de corelaţie între scorurile. observate şi scorurile reale 
este egal cu raportul dintre dispersia scorurilor reale şi dispersia scorurilor 
observate: 


k CV ua 


oi Co iii. Ta) = Cer i W. 23) 


m Khe) 


El se numeşte coeficient de fidelitate al testului mn. 

Coeficientul de corelaţie p(X7,+, 7.) se numeşte indice de fidelitate. El 
arată cât de puternică este legătura liniară dintre scorurile observate şi scorurile 
reale pentru instrumentul de măsură meM. 


6.1.2. Instrumente de măsură echivalente, instrumente de măsură 
paralele 


DEFINIŢIA 6.1.2.1 (Lord, Novick, 1968). Două instrumente de măsură 
distincte aeM şi beM sunt echivalente în populaţia P dacă pentru orice 


persoană peP : 
© scorul real este acelaşi: 
taal (6.1.2.1) 
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şi 
e erorile de măsură Sunt identic distribuite, adică Ep $i Ey au aceeaşi 
repartitie. 
Dacă este îndeplinită numai condiţia 6.1.2.1, atunci instrumentele de 
măsură a Şi P se numesc t-echivalente. 


DEFINIȚIA 6.1.2.2 (Lord, Novick, 1968). Instrumentele de măsură distincte 
aeM şi beM sunt esenţial T-echivalente dacă pentru orice persoană peP 
ui scorurilor reale este aceeaşi: | 

- Tap = constant | (6.1.2.2) 


DEFINIŢIA 6.1.2.3 (Lord, Novick, 1968). Instrumentele de măsură distincte 
„aeM şi beM sunt paralele dacă pentru orice persoană peP: 
e scorul real este acelaşi: 
l fos Tip | (614553) 
$1 | 
e erorile de măsură au aceeaşi abatere standard: 


(Ep) = AE ty) (6.1.2.4) 


Deci, doua instiyinătite de măsură paralele măsoară exact acelaşi lucru, 
în aceeaşi scară (T= Ta) şi îl măsoară la fel de bine (K ) = of, )), pentru 
fiecare persoană.  : 


Relaţia de paralelism este mai slabă decât relaţia de echivalență, iar 
relaţia de z-echivalenţă este mai slabă decât cea de paralelism: 
echivalență => paralelism => t-echivalenta 


Se poate demonstra următoarea ponies necesară şi suficientă pentru 
ca două măsurători să fie paralele: 


TEOREMA 6.1.2.1 (Lord, Novick, 1968). Două instrumente de măsură 
distincte, aeM şi beM, sunt paralele în populația P dacă şi numai dacă în orice 
subpopulatie a lui P scorurile observate au aceeaşi medie şi aceeaşi dispersie: 
MA )>=M(A) (6.1.2.5) 
Şi 
P(X) =T (X) (6.1.2.6) 


* Din această teoremă se constată că două instrumente de măsură paralele 


într-o populație P sunt paralele si in orice subpopulatie a lui P. Dar, într-o 
„populaţie mai mare decât P s-ar putea să nu mai fie paralele. 
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TEOREMA 6.1.2.2 (Lord, Novick, 1968). Fie k un număr natural mai mare 
decât 1, my, Ma... my instrumente de măsură paralele din M şi m, un instrument 
. de măsură distinct, ales arbitrar. Atunci, în orice subpopulatie a lui P sunt 
adevărate următoarele afirmaţii: 

a. toate intercorelatiile instrumentelor paralele sunt egale: 


p(x oR Xn, «) = constant ae Pw 1,.2,.7) 


ij=1,2,...,k, iz] 
` b. toate instrumentele de măsură paralele corelează la fel. de bine cu 
instrumentul m: 


p(X, m» hed = constant | (6.1.2.8) 


E ZI See, 

Întrucât repartitiile variabilelor alai Arp» pentru persoanele p din 
populaţia P şi instrumentele de măsură m din mulţimea M, nu sunt cunoscute, 
paralelismul a două instrumente nu poate fi verificat utilizând definiţia. Nici 
teorema care furnizează condiţiile necesare şi suficiente pentru paralelism nu 
poate fi folosită, deoarece nu se cunosc repartiţiile variabilelor X,,. Din aceste 
a Und în practică, studierea paralelismului a două sau mai multe teste, m, 
MM asa: Mp Se face prin verificarea, pe baza scorurilor observate ale eşantionului 
căruia i s-au administrat testele, a următoarelor egalitati: 


MEn) = Mm FY=1,2,...5K li (6.1.2.9) | 
ab Gt = (Xn) Yoi, à (6.1.2.10) 
PX n,» a Kne) = constant,  ij=1,2,...,k, i#j (ae ot 
P(ă « a AS) = constant, i 1=1,2,...k Cot. 2.12) 


m, fiind un test arbitrar. 
Se utilizează teste statistice adecvate. 
i Trebuie menționat, însă, că egalitatile de mai sus reprezintă numai 
condiții necesare, nu gi suficiente pentru paralelism. Dacă ele nu sunt verificate, 
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atunci cu certitudine instrumentele de măsură nu sunt paralele. Dar, realizarea 
acestor egalitati pentru eşantionul testat nu asigură paralelismul. 


TEOREMA 6.1.2.3 (Lord, Novick, 1968). Dacă aeM şi beM sunt două 
instrumente de măsură paralele şi.dacă pentru orice persoană peP scorurile 
observate Xp şi Xp sunt variabile aleatoare independente, atunci, în populaţia 
P, au loc următoarele relaţii: 


JR Ts ee Pa > pee oe) (6.1.2.13) 


Aceasta înseamnă că pătratul coeficientului de corelaţie liniară între 
scorurile reale şi scorurile observate la un test (care, reprezintă coeficientul de 
fidelitate al testului) este egal cu coeficientul de corelaţie liniară între scorurile 
observate la acest test şi la un test paralel cu el. 


6.1.3. Eroarea standard de măsură 


Fie € un număr real pozitiv. Din inegalitatea lui Cebisev: 


2 
o (Enp) 
PX = otf ahaa’ <p © (6.1.3.1) 


se constată că dispersia erorilor de măsură pentru o persoană peP, P (Enp), este 
un indicator al preciziei măsurătorii pentru respectiva persoană: atunci când 
P (Emp) este mic, există doar puţine şanse ca scorurile observate să difere de 
scorul real. 

Trebuie remarcat că dispersia erorilor pentru o persoană este egală cu 
dispersia scorurilor observate ale persoanei respective: 


(Enp) =T (Xp) (6.1.3.2) 
_ Dispersia erorilor poate să difere mult de la o persoană la alta în 
populația P. 


Întrucât dispersia erorilor de măsură în populația P, 0(£,,+), este egală 
cu media dispersiilor erorilor de măsură pentru toate persoanele din P: 

P (Ep) = M,0 (Enp) (6.1.3.3) 
se consideră că disperia erorilor de măsură în populația P este un indicator al 
impreciziei medii a măsurătorilor în populația P. 

Abaterea standard a erorilor de măsură, O(E,»), se numeşte eroare 
standard de măsură în P. În continuare o vom nota cu Oy: 
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o= Ep) i (6.1.3.4) 


6.2. TEORIA RASPUNSULUI LA ITEMI 


Teoria răspunsului la itemi nu este cu adevărat o teorie; ea reprezintă 
o colecție de modele şi metode statistice cu ajutorul cărora se dă un sens datelor 
provenite din măsurători psihologice (Steinbėrg, Thissen, 1996). 


6.2.1. Variabile latente, variabile observate 


Teoria răspunsului la itemi are la bază următoarele postulate 
(Hambleton, Swaminathan, Rogers, 1991; Steinberg, Thissen, 1996): 

a. Comportarea unui subiect la un item al unui test poate fi explicată 
(sau prezisă) cu ajutorul unui set de factori numiți trăsături, trăsături latente 
sau abilități. Orice construct inobservabil, presupus continuu, în privința căruia 
o teorie psihologică afirmă că persoanele se deosebesc între ele poate fi privit 
ca factor. Fiecărui factor i se asociază o variabilă cu valori numerice, cuprinse 
între -œ şi +œ, continuă, denumită variabilă latentă. 

b. Se inferează existența unui factor numai după ce se observă că 
răspunsurile la itemii prin care se doreşte măsurarea constructului covariază 
(variază la fel). 

c. Relaţia dintre performanța la item a subiecţilor şi fiecare dintre 
trăsăturile care are legătură cu performanţa poate fi descrisă prin câte o funcţie 
crescătoare denumită funcţie caracteristică a itemului sau curbă caracte- 
ristică a itemului. Această funcţie arată cum depinde probabilitatea de a : 
răspunde corect (sau afirmativ) la item de nivelul trăsăturii. 

O trăsătură nu poate fi nici observată, nici măsurată direct. Măsura ei 
se obţine indirect, prin intermediul uneia sau al mai multor variabile observate 
(de exemplu, răspunsurile la itemii unui test sau chestionar), despre care se 
presupune că reprezintă adecvat variabila latentă. 

Operarea cu variabile latente impune rezolvarea a trei probleme 
(Andrich, 1988): 


A. Definirea variabilei latente in termeni operafionali, care sa permită | 
măsurarea ei, acţiune denumită construirea variabilei. 

Adesea, pentru construirea unei variabile se identifică ie diferenţe 
individuale care fac posibilă reprezentarea fiecărui individ printr-un punct pe 
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axa reală. Despre o asemenea variabilă se spune că este unidimensională. Dacă, 
însă, o reprezentare acceptabilă a caracteristicilor considerate necesită utilizarea 
unui Spaţiu cu mai multe dimensiuni, se spune că variabila este 
multidimensională. i 

Orice performanță umană, acțiune sau credință este complexă si implică 
o multitudine de aptitudini, interese etc. Reducerea ei la o singură dimensiune 
poate fi realizată în mai multe moduri. Din acest motiv, o variabilă 
unidimensională reflectă concepţia celui care o construieşte. Pentru o aceeaşi 
caracteristică psihică, doi autori diferiţi pot propune variabile diferite. 


B. Definirea situaţiilor controlabile care permit obţinerea de informaţii valide 
şi repetate asupra variabilei cercetate, operaţie denumită crearea cadr ului de 
observaţii. Asemenea situaţii sunt reprezentate de itemii de test. 

Rezultatul obsarugiltign¢ este exprimat numeric, printr-un scor, 


C. Alegerea modelului matematic pentru obţinerea valorii variabilei latente pe 
baza valorilor variabilelor observate. 

În majoritatea cazurilor, itemii conţin afirmaţii sau întrebări la care 
există un număr redus de variante de răspuns (de exemplu, "da"/"nu", 
"rareori"/"uneori"/"adesea"). Deci fiecare item furnizează un scor dintr-o 
mulţime discretă, cu puţine elemente. Scorul total al testului, calculat pe baza 
scorurilor itemilor, ia de asemenea valori dintr-o mulţime discretă. 

Variabila latentă, prin definiţie, este continuă şi ia valori pe întreaga axă 
reală. 

Deci, modelul matematic ales trebuie să transforme o mulţime discretă 
(mulţimea scorurilor observate la un item sau la test) în mulţimea numerelor . 
reale. 

Variabilele latente apar în două tipuri de modele utilizate pentru 
reprezentarea legăturilor dintre variabilele psihologice (Ozer, Reise, 1994): 

e În modelele care măsoară cauzele se presupune că variabila latentă 
este cauza variațiilor variabilelor observate. Acest model stă la baza standardelor 
actuale, care cer ca o măsură bună a unui construct să aibă o consistenţă internă 
ridicată. 

e În modelele care E cară efectele, variabila latentă este cauzată de 
variabilele observate. Uneori, variabila efect este privită ca o combinaţie liniară 
a mai multor variabile observate (aşa se întâmplă, de exemplu, pentru 
leadership). Alteori, ca, de exemplu, pentru extraversiune, relaţia dintre cauze 
şi efect nu poate fi exprimată printr-o ecuaţie de regresie liniară multiplă. 

Dacă se utilizează mai multe variabile observate (instrumente de 
măsură) pentru cercetarea aceleiaşi variabile latente, se presupune că în spatele 
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covariatiilor existente între variabilele observate stau relaţiile dintre aceste 
variabile şi variabila latentă pe care o măsoară. Deci se consideră că variabila 
latentă explică relaţiile dintre variabilele observate. 

Această idee a stat la baza utilizării analizei factoriale ca model 
“matematic ce permite determinarea valorilor unuia sau al mai multor factori 
„(variabile latente) pornind de la mai multe variabile observate (teste). 

Prin analiză factorială, pentru fiecare persoană se înlocuiesc scorurile 
realizate la teste (valorile variabilelor observate) cu scorurile factoriale (valorile 
variabilelor latente măsurate de teste). Aceste scoruri factoriale sunt utilizate 
pentru caracterizarea persoanei sau pentru efectuarea. de predicții, prin 
introducerea lor în calculul valorilor unor funcţii de regresie. 


Administrând unei populaţii un set de itemi dihotomici despre care se 
presupune că măsoară aceeaşi variabilă latentă unidimensională se pot face 
următoarele două observaţii importante: 

"e persoane diferite răspund diferit la itemi, ceea ce se poate explica prin 
deosebirea dintre indivizi în privinţa variabilei latente măsurate; 

e o aceeaşi persoană dă răspunsuri diferite la itemi diferiţi, deşi aceştia 
măsoară aceeaşi variabilă latentă; explicaţia posibilă ar fi că itemii măsoară în 
_ mod diferit variabila latentă. L.L. Thurstone a denumit aceasta caracteristică a 
itemilor "valoare afectivă" (Andrich, 1988). 

Pentru modelul matematic care leagă valorile variabilei observate 
corespunzătoare unui item, de valorile variabilei latente a fost propusă ecuaţia 
următoare (Andrich, 1988): 


P(X=x|p) = RY), B, x) (621.1) 


unde: 

a este variabila aleatoare corespunzatoare itemului considerat; 
xe {0,1} este un scor posibil la item; | 

p este o persoană care a răspuns la item; 

Y(p) reprezintă valoarea variabilei latente pentru persoana p; 

B este valoarea afectivă a itemului; 
f este o funcție, a cărei expresie analitică trebuie precizată. 


Deci, probabilitatea ca o persoană p să dea un anumit răspuns la item 
( P(X=x|p)) depinde atât de persoană (Y(p)), cât si de item (B). 
Făcând următoarele ipoteze: 


Y(p)>0 pentru orice persoană p ` (6.2.1.2) 


B>0 . (6.2.1.3) 
Rasch a propus pentru funcția f ga (Andrich, 1988): 
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. (6.2.1.4) 

Se observă că, atunci când raportul Y/B este mare (ceea ce se întâmplă 
când nivelul subiectului în privinţa variabilei latente măsurate de item este 
ridicat sau valoarea afectivă a itemului este ea) probabilitatea de obţinere 
la item a scorului 1 este mare. 


Din relaţia 
Yp) _ P(X=1|p) 
aS ee 6.2.1.5 
B  -P(X=0|p) l 


ţinând seama că pentru un item fixat valoarea B este constantă, se deduce că 
valoarea variabilei latente pentru o persoană, Y(p), este proporţională cu raportul 
dintre probabilitatea ca persoana respectivă să obţină la item scorul 1 şi 
probabilitatea de a obţine scorul 0. Cu cât variabila latentă are o valoare mai 
mare, cu atât mai mare este probabilitatea persoanei de a obține scorul 1, 
comparativ cu probabilitatea de a obține scorul 0. 

Sa presupunem că doi itemi, 7 si j, având valorile afective B, si, 
respectiv, B, sunt independenți probabilistic între ei, pentru orice persoană p. 
Aceasta î înseamnă că oricare ar fi două scoruri posibile la itemi, x,ye {0,1} are 
loc egalitatea 
P((XEx)N FY) | p) = P(X) | p) PKA») Ip) (6.2.1.6) 

În acest caz se poate deduce relaţia 


P=) op), at tu (6.2.1.7) 


P(X =} XD B, 


Deci, pentru orice persoană, indiferent de valoarea variabilei latente a 
acesteia, raportul dintre probabilitatea de a obține scorul 1 numai la itemul i si 
probabilitatea de a obţine scorul 1 numai la itemul j este aceeaşi, dependentă 
doar de caracteristicile celor doi itemi. 

Introducând notatiile: 


=In() (6.2.1.8) 
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= In (B) (6.2.1.9) 
şi utilizând relația 


TY ; : 
In(—) = y-b 6 fw. RO 
ga y ( ) 


formula de definiţie a funcţiei f, (6.2.1.4) se transcrie astfel: 


1 +x[eXP)-b-1] | lie 
ja = A ooo 42 
(X=x|p) pes (6.2.1.11) 


Valoarea y(p) reflectă nivelul variabilei latente pentru persoana p (y 
fiind imaginea valorii variabilei latente, Y, printr-o funcţie crescătoare), iar _ 
valoarea b caracterizează itemul. La un nivel y fixat, probabilitatea de a obţine 
scorul 1 este cu atât mai mare, cu cât parametrul b este mai mic. | 

Scopul teoriei răspunsului la itemi este de a elabora metode de estimare 
a valorii variabilei latente la persoanele testate şi a caracteristicilor itemilor 
testului, pe baza răspunsurilor date de subiecţi la itemi. 


6.2.2. Funcţia caracteristică a unui item 


În cele ce urmează ne vom referi doar la itemi dihotomici şi vom utiliza 
expresia "itemul a fost rezolvat corect (respectiv greşit)" cu înţelesul "s-a obţinut 
la item scorul 1 (respectiv 0)". | 

Vom presupune că toţi itemii testului măsoară aceeaşi variabilă latentă 
unidimensională. 
| Teoria răspunsului la itemi impune în acest caz EEA unidimensio- 

nalitatii spațiului variabilelor latente, ceea ce înseamnă că nu există o altă 
variabilă latentă, pe lângă cea specificată, care să influențeze scorurile itemilor. 

Această ipoteză asigură îndeplinirea "condiției de independență locală 
a itemilor", care cere ca modul în care o persoană răspunde la un item să nu fie 
influențat de felul în care a răspuns la ceilalți itemi (De Gruijter, Van der Kamp, 
1984). Trebuie menționat că presupunerea de independență locală a itemilor nu 
implică faptul că itemii sunt necorelati în întregul lot de subiecți. Daca 
persoanele examinate diferă în privința variabilei latente măsurate de itemi, 
corelatiile dintre itemi vor fi diferite de zero. 
| Teoria răspunsului la itemi construieşte, pentru fiecare item al testului, 
funcţia caracteristică a itemului (Lord, 1980; De Gruijter, Van der Kamp, 
1984). Această funcţie leagă valorile variabilei latente măsurate de item cu 
scorurile obţinute la item. Ea este definită astfel: \ 
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P:R-> [0,1] 
P(y) = probabilitatea ca o persoană având nivelul variabilei latente măsurate 
de item egal cu y să răspundă corect la item, 
pentru orice valoare posibilă, yeR. 

Cu ajutorul acestei funcţii pot fi apreciate calităţile itemului (dificultatea 
şi puterea de discriminare). Graficul său realizează o vizualizare a eager 
itemului ca instrument de măsură. 

Teoria răspunsului la itemi face ipoteza că funcţia P este crescătoare 
(Lord, 1980). Într-adevăr, dacă itemul este un instrument de măsură bun, este 
logic ca o persoană care are un nivel mai înalt al variabilei latente să aibă şanse 
mai mari de a rezolva corect itemul decât un subiect care are un nivel mai 
scăzut. 

Se mai presupune că toţi itemii testului au funcţiile caracteristice din 

aceeaşi clasă de funcţii. 
Dintre clasele de funcţii propuse, un model considerat ca fiind foarte 
apropiat. de ceea ce se întâlneşte obişnuit în practică este cel logistic (Lord, 
1980), care utilizează funcţii de forma următoare : 


hi l -c ) 
P(y) =c + Tae 110) (62.241) 


a, b şi c sunt parametri care caracterizează itemul, iar e este constanta 2.71828. 
Graficul funcţiei P este prezentat în figura 6.2.2.1. 


tg « = 0,425a(l-c) 


) a 
(ct1)/2 


Figura 6.2.2.1 
Funcţia caracteristică a itemului (model Lord) 
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| Parametrul c reprezintă probabilitatea ca o persoană complet lipsită de 
caracteristica măsurată de item (y=-~) să răspundă corect. Se numeşte 
parametru de ghicire sau nivelul scorului pseudoşansei. Dacă la un item nu 
se poate răspunde corect prin ghicire, atunci c=0. 
| Parametrul b, numit dificultatea itemului, determină poziţia curbei: cu 
cât itemul este mai dificil (b este mai mare), cu atât curba are porţiunea cu 
creştere mai rapidă deplasată mai mult să dreapta. ca i P are un punct de 
inflexiune pentru y=b. 

Daca nu se poate ghici demain (c=0), atunci b reprezintă nivelul 
variabilei latente, y, pentru care şansa de a răspunde corect este de 50%. Dacă - 
răspunsul corect poate fi ghicit (c+0), atunci b reprezintă nivelul caracteristici 

-y la care probabilitatea OTE corect se află la jumătatea distanţei dintre c 
şi 1: 3 


P b T 


Parametrul a este proporțional cu panta funcției caracteristice a itemului 
în punctul de inflexiune. Mai precis, coeficientul unghiular al tangentei la curbă 
` în punctul y=b este egal cu 0.425a(1-c). Aceasta înseamnă că viteza cu care 
variază probabilitatea de a răspunde corect atunci când nivelul variabilei latente 
. este egal cu b, este cu atât mai mare, cu cât a este mai mare şi c este mai mic. 
Parametrul a este denumit puterea de discriminare a itemului. 

Dacă c=0 (nu există posibilitatea de ghicire a răspunsului la item) şi 
a=1/1.7, atunci se regăseşte modelul lui Rasch, definit prin ecuaţia (6.2.1.11). 
În acest caz, funcţia caracteristică a itemului este: 

eW-b) 


P(y)=———— BS) 
0)= ES | VO ee wD) 


Deci, in modelul lui Rasch, valaen afectivă a itemului, B, este legată de 
dificultatea itemului: B=et. 

Modelul propus de Lord pentru funcţia caracteristică a itemului conduce 
la o dreaptă numai în următoarele situaţii : 


c=]: atunci P(y)=1 pentru orice y, adică toţi examinatii au şansa de 
100% sa raspunda corect; i 
a=0: atunci P(y)=(c+1)/2 pentru orice y. 
In modelul propus de Lord funcția caracteristică a itemului i ia valori în 
intervalul (c,1), având asimptotele orizontale y=c si y=1. Deci niciodată 
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probabilitatea de a răspunde corect nu va putea fi egală cu c sau cu 1. Aceste 
valori sunt atinse doar pentru y=-% şi, respectiv, y=+oo, 
Guilford (1965) imaginează un alt model pentru funcţia caracteristică 
a itemului, fără a propune, însă, forma analitică a funcţiei P. El consideră că 
funcţia P este definită şi nedescrescătoare pe un anumit interval [vs Yma], cu 
proprietatea că există o valoare y,> Ymin Sub care nici o persoană nu rezolvă corect 
itemul: 4 
P(y)=0 pentru ysy, 
şi există o valoare y,, VySV)< Vpn dincolo de care toată lumea răspunde corect la 
item: 
P(y)=1 pentru y>y,. 
Intervalul [y, y,] se numeşte "zonă de tranziţie". 
Modelul propus de Guilford pentru curba caracteristică a itemului este 
reprezentat grafic în figura 6.2.2.2. 


Figura 6.2.2.2 
Curba caracteristica a itemului (model Guilford) 


Un item este uşor atunci cand pentru valori ale lui y apropiate de Vmin 
funcţia P creşte rapid, apropiindu-se de valoarea 1. Itemul este dificil dacă 
pentru valori ale lui y apropiate de y,,,, valorile funcţiei P sunt indepartate de 
valoarea 1. În figura 6.2.2.3 itemul 1 este mai uşor decât itemul 2. 
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Figura 6.2.2.3 
Curbele caracteristice pentru doi itemi de dificultăţi diferite 


Panta funcţiei caracteristice a itemului într-un anumit punct (y,P(y)) este 
denumită precizia curbei la nivelul y al variabilei latente, deoarece cu cât panta 
este mai mare, cu atât itemul discriminează mai bine între cei care au nivelul 
variabilei latente apropiat de y. j 

În exemplul următor (figura 6.2.2.4) itemul A a Mai mai bine 
decît itemul B la nivelul caracteristicii y=y., întrucât tangenta la curba 
caracteristică a itemului A, în punctul (y+,P(y.)), formează cu abscisa un unghi 
mai mare decât cel zu de tangenta la curba caracteristică a itemului B în ` 
acelaşi punct. 


Itenul A 
Itemul B 


Figura 6.2.2.4 
Curbele caracteristice pentru doi itemi cu precizii diferite la nivelul y. 
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Guilford (1965) propune ca la construcţia unui test să se aleagă itemi 
având o precizie mare în zona de tranziţie şi ale căror zone de tranziţie să ocupe 
“poziţii diferite în intervalul MAE A (figura 6.2.2.5). În felul acesta s-ar 

obține un test cu o bună capacitate de discriminare între persoane. 


Figura 6.2.2.5 
Alegerea itemilor pentru construirea unui test psihologic 


Læ determinarea parametrilor funcției caracteristice a unui item 
intervine un aspect deosebit de dificil: valorile caracteristicii măsurate de item 
(cunoştinţe sau priceperi) nu sunt şi nici nu pot fi cunoscute. În teoria 
răspunsului la itemi (Lord, 1980; De Gruijter, Van der Kamp, 1984) sunt 
descrişi, însă, unii algoritmi care permit ca pe baza răspunsurilor date la un test 
de către un lot de persoane să se estimeze atât parametrii itemilor testului 
(coeficienţii care apar în expresia analitică a funcţiilor caracteristice), cât şi 
valorile caracteristicii măsurate de itemi, la persoanele examinate. 


6.2.3. Utilizarea rezultatelor la un test 


Să considerăm un test format din itemii Thy J sef Cu funcţiile 
caracteristice la item, P, J=1,2,...,n, cunoscute. Scorul testului se calculează prin 
însumarea scorurilor itemilor, deci ia valori din mulţimea {0,1,...,7}. 
Probabilitatea ca o persoană care are valoarea factorului măsurat de itemi egală 
cu y să obţină la test scorul ke {0,1,...,727} este egală cu coeficientul termenului 


x*, Ap din polinomul 
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Reef (P x+ [1-P O} = Ans tanasin 
A EN 


"Cu aceste notații, variabila aleatoare (X]y) care corespunde scorului 
observat la test, la nivelul y al factorului, are repartiţia de frecvenţe 


H 
; : (6.2.32) 
A, k=0,1,....7 ie: 


Din repartiţia de frecvenţe a variabilei (X|y) se deduce că, pentru orice 
persoană având valoarea factorului măsurat de itemi egală cu y, "scorul gal 
egal cu media variabilei "scor observat" este 


SOMA oe PO) EN, (6.2.3.3) 
; jel 


Înseamnă că toate persoanele care au aceeaşi valoare a factorului au 
acelaşi scor real. Adică, scorul real şi valoarea factorului sunt acelaşi lucru, dar 
„măsurat în scale diferite. Deosebirea esenţială între ele constă în faptul că scorul 
real depinde de caracteristicile itemilor testului. 

„ Funcţiile P, j>=1,2,...„n fiind crescătoare, rezultă că şi funcţia scor real 
S este crescătoare. 

Diferenţa dintre scorul observat şi scorul real al unei persoane se 
numeşte eroare de măsură. Ea poate fi privită ca o valoare a variabilei aleatoare 

(E | y)=(X| y)-MX|y) ~ (6.2.3.4) 

y fiind valoarea factorului pentru persoana respectivă. Abaterea standard a 
variabilei (E | y) se numeşte eroare standard de măsură gi este un indicator al 
preciziei testului, arătând cât de mult se abat scorurile observate de scorul real. 

Spre deosebire de teoria clasică a testelor, unde eroarea standard de 
măsură este constantă pentru întreaga populație, în teoria răspunsului la itemi 
eroarea standard de măsură variază în funcție de nivelul factorului măsurat de 
test, y. owl f 

Din legea de repartiție a variabilei (Xļy) se deduce 


ont 
orEly)=2, PONP O] , (6.2.3.5) 
iB 
Daca P, J=1,2,...,7, sunt funcţii logistice, atunci: 
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lim 9%E|y)=0 (6.236) 
yrs 


(la niveluri foarte înalte ale factorului testul are o precizie foarte bună) şi 


lim o°(Ely)=)) o(1 -c) (6.2.3.7) 


ys i=] 


La nivelul y al factorului, probabilitatea de a obține scorul u,e {0,1} la 
itemul ij, J=1,2,...,” poate fi scrisă sub forma | 


P(uly)=[P,O)L -P o (6.2.3.8) 


In ipoteza independenței locale, probabilitatea ca un subiect, a cărui 
valoare a factorului este egală cu y, să obțină la cei n itemi ai testului scorurile 
“Up Ur... (U, este scorul la itemul i, j=1,2,...,7) este egală cu 


Paula] »=Ul [P o U -P ™" (632289) 


Una dintre problemele la care trebuie să răspundă teoria răspunsului la 
itemi este aceea de a identifica nivelul factorului măsurat de test, pentru un 
subiect care la itemii i, J>1,2...h, cu funcţiile caracteristice la Ilea eta 
cunoscute, a obţinut scorurile uj, J=1,2,....n. O modalitate de rezolvare, constă în 
determinarea valorii y care maximizează probabilitatea P(U ppU3=++4,]Y). In teoria 
răspunsului la itemi se rezolvă ecuaţia 


Oln P(2,,t>,...,2,,|y) m 


(6.2.3.10) 
oy 
Aceasta se transcrie sub forma: — 
n P. i 
pa UAI PD RI =0 (6.2.3.11) 
FLP OL -P O] 


Se impune cercetarea existenței şi a unicitatii soluției ecuației (6.2.3.11) 
precum şi a modalităţii de rezolvare. De exemplu, dacă toate funcțiile P, 
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J=1,2,...,, sunt funcţii logistice cu aceiaşi parametri a, b şi c, Mad f= SD) 
atunci ecuatia (6.2.3.11) devine: 


PI u, (6.2.3.12) 


Daca c>0, iar uFu=.. =u, =0 ecuația (6.2.3.12) nu are soluție. 
Problema cea mai dificilă a teoriei răspunsului la itemi o constituie 
bane functiilor răspunsului la item, P,, respectiv a parametrilor a, „b;şi 
i J=1,2,...., întrucât la prima administrare a testului nu se ide oF 
viveluaile factorului pentru Pa aes examinate şi nici aceşti parametri. 
Se notează cu U; s, U2,5...,4,; cotele celor n itemi pentru fiecare subiect 
s=1,2,...,S care a rezolvat testul = se construieste funcţia 


L(a,b,c,y)= feo PAV (6-2.3.13) 


s=] j=1 


unde a= (Aaa... a”), = =(5),b2,...5 b,n), c= (CpCa... ay CE Ws): 
Pentru determinarea veetarilor necunoscuţi a, b, c şi y se rezolvă 
sistemul: l 


OL(a,b,c,y) _ o 
ða; i 
OL(a,b,c,y) - 0 


ðb, 


OL(a,b,c,y) _ -0, 
dc; | 

oL(a,b,c,y) -0. 
Oy, AL 


j=1,2,...n 
IETEN 
J=1,2,...57 


s=1,2,.,.,8 


i ` (6.2.3.14) 
Si acest sistem trebuie studiat în privința existenței şi a unicității soluției. 


Teoria Serii la itemi este utilizată mai ales î în testarea adaptativă. 

Testele adaptative utilizează, pentru selectarea itemului care se 
administrează în fiecare moment, funcţia de informaţie a itemului. Aceasta 
este definită prin formula (Lord, 1980): 
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y- POF 
Ky) POU -PO)} (024.3 MED} 


unde P este funcţia caracteristică a itemului, iar P' reprezintă derivata funcţiei 
DP. 
| Valoarea /(y) este invers proporţională cu pătratul erorii standard cu 
care y poate fi măsurat de item (Weiss, Vale, 1987). Deci, un item aduce 
informaţia maximă la acel nivel y pentru care I(y) este maxim. 

În modelul lui Lord, la un nivel y fixat, valoarea funcţiei de informaţie 
a itemului, (y) este direct proporţională cu pătratul puterii de discriminare a 
itemului, a. Deci informaţia adusă de item este cu atât mai multă, cu cât itemul 
discriminează mai bine. 

Pornind de la o mulţime de itemi ai căror parametri sunt cunoscuţi, se 
poate construi un test adaptativ după următorul algoritm (Stocking, 1987; 
Weiss, Vale, 1987; Schoonman, 1989): - 

(1) Se alege primul item, aleator, dintr-un grup de itemi care au valoarea 
maximă a funcţiei de informaţie la un nivel mediu al variabilei latente măsurate. 

(2) Dacă acest item a fost rezolvat corect (respectiv, greşit), se alege al 
doilea item, aleator, dintr-o mulţime de itemi ale căror funcţii de informaţie au 
valoarea maximă pentru o valoare ridicată (respectiv, scăzută) a variabilei 
latente. 

(3) Se estimează valoarea variabilei latente, Ys. 

Dacă este satisfăcut criteriul de stop, se opreşte testarea, în caz contrar 
se alege un item care are valoarea maximă a funcției de informatie în y. şi se 
reia de la pasul 3. | 


6.3. TEORIA STARILOR SI A TRASATURILOR LATENTE 


6.3.1. Ideea de bază a teoriei stărilor şi a trăsăturilor latente 

Descrierea şi explicarea stabilităţii şi a schimbării în comportamentul 
uman sunt sarcinile de bază ale teoriei psihologice şi ale evaluării psihologice. 

| Orice atribut psihologic poate fi analizat cel puţin din două puncte de 

vedere, şi anume: | 

e al diferenţelor interindividuale; 

e al diferenţelor intraindividuale (sau al schimbărilor care au loc la 
fiecare individ). 
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Disciplinele tradiţionale ale psihologiei sunt interesate in principal de 
câte un singur tip de diferenţe. | 

Psihologia diferenţială îşi concentrează atenţia asupra deosebirilor 
dintre persoane, adică asupra diferenţelor interindividuale. 

Psihologia generală (de exemplu învăţarea, percepţia), psihologia 
socială şi psihologia dezvoltării se ocupă de descrierea şi explicarea deosebirilor 
„de comportament ale aceleiaşi persoane de la o situaţie la alta şi de la un 
moment la altul, adică a deosebirilor intraindividuale. 

l Fiecare din aceste perspective consideră că celelalte surse de varianță 
sunt mai puţin importante sau mai puţin interesante pentru explicarea 
comportamentului. 

Teoria stărilor şi a trăsăturilor recunoaşte pentru atributele psihologice 
existența atât a deosebirilor dintre indivizi, stabile în timp, cât si a schimbărilor 
intraindividuale. Ea consideră că fiecare atribut psihologic observat este afectat 
într-un anumit grad de: 

e caracteristici ale individului; 

e caracteristici ale situației şi/sau ale influențelor « care interacționează; 

e eroarea de măsură. 

_. Prin urmare, rezultatul măsurării unei variabile observate se 
descompune în: 

(1) o componentă care nu depinde de situaţie şi/sau de efectele 

interacțiunilor; 

(2) o componentă care depinde de sane si/sau de iyaactiyni; 

(3) o eroare de măsură. 

Prima componentă este denumită trăsătură; suma primelor două 
componente este denumită stare. 

Existența componentei (2) are implicații importante asupra evaluării 
. psihologice. Construirea şi utilizarea instrumentelor de măsură impune să se 
„ cunoască nu numai fidelitatea acestora ci şi cât de mult ele măsoară caracteristici 
stabile ale persoanelor şi cât de mult ele sunt afectate de situaţia în care se face 
măsurarea. Când se urmăreşte măsurarea trăsăturilor, rezultatele măsurărilor 
trebuie să fie afectate cât mai puţin de efectele specifice ocaziei de măsurare. 
Când se evaluează starea, instrumentul utilizat trebuie să fie sensibil la 
influenţele situaţiei. 


6.3.2. Scopul teoriei stărilor şi a trăsăturilor latente 


Teoria stărilor şi a eee Ter încearcă să dea răspuns la următoarele 
întrebări: 
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e Cum putem afla dacă in răspunsurile date de un individ la un 
chestionar care măsoară o trăsătură de personalitate intervin sau nu efectele 
situaţiei de măsurare ? 

e Dacă există efecte ale situaţiei, ce relaţie există între scorul obţinut 
la scală şi trăsătura măsurată ? 

| e Ce relaţie există între stări şi trăsături ? 


6.3.3. Variabile utilizate de teoria stărilor şi a trăsăturilor latente 


Vom prezenta modelul matematic propus de teoria stărilor şi al 
trăsăturilor prin comparaţie cu cel utilizat de teoria clasică a testelor. Pentru 
aceasta vom relua ideile de bază ale teoriei clasice a testelor în formularea dată 
de D. W. Zimmerman (Steyer, 1989). 

În teoria clasică a testelor se lucrează cu experimente aleatoare de 
următorul tip: 

Se presupune că o mulţime de persoane P a fost examinată cu un 
chestionar compus din m itemi. Notând cu S; mulţimea răspunsurilor posibile 
la itemul i, i=1,2,...,m, produsul cartezian i 

; M=S,xS>x...xS,, 
reprezintă mulţimea răspunsurilor posibile la chestionar. 
„De exemplu, dacă un chestionar este compus din 3 itemi cu răspunsurile 
posibile "da" şi "nu", atunci S,;=S,=S;={"da","nu"}. 

Rezultatele posibile ale. experimentului aleator considerat în teoria 
clasică a testelor formează produsul cartezian 
Z = PxM = Px(S;xS,x...xS,,) 

Fiecare element al său (p,5,,5,,...,5,,)€Z este constituit dintr-o persoană, 
pEP, şi m rezultate la itemi s;€S,, i=1,2,....m. 


Se notează 
Po: Z->P operatorul care ia ca valori persoanele din P; 
Y,:Z->R variabila care ia ca valori scorurile la itemul i, i=1 Pe RT ht) 


Fiecare variabilă Y, i=1,2,...,, este o variabilă aleatoare. În mulţimea 
de persoane P, ea ia fiecare valoare cu o anumită probabilitate. 

Dacă în exemplul anterior fiecare item este cotat cu 1 pentru răspunsul 
"da" şi cu 0 pentru răspunsul "nu", atunci fiecare din variabilele Y,, Y,, Y, ia 
valorile 0 şi 1 cu anumite probabilitati (care, de obicei, sunt diferite de la o 
variabilă la alta). 
| Pentru fiecare persoană peP şi pentru fiecare item i=1,2,...,m, se 
definesc variabilele: i 
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e scor siie care se obține din variabila Y, punând condiţia ca din . 

mulţimea P să fie aleasă persoana p: (Y;| pop); 
_ © scor real, T, ca fiind media variabilei aleatoareny ¥ conditionata de 
alegerea persoanei p din multimea P: | 
T,=M(¥j| pep) (6.3.3.1) 

Adică T, este media tuturor valorilor de scor care ar fi putut fi obtinute de 
persoana p la itemul i, dacă s-ar fi facut toate măsurătorile posibile. 

Variabilele eroare, E, pentru persoana p şi fiecare item i, i=1,2,.. 
se defi nee ca fiind difer ERT dintre scorul observat şi scorul real la taa 


Tep die da T, : $ (6.3.3.2) 


În teoria stărilor şi a trăsăturilor se presupune că există n ocazii de 
măsurare, nz 1. (de obicei n>2). 

În locul mulţimii de persoane P se consideră: 

e o mulţime de persoane Pşi _ i 

e n mulţimi de situaţii posibile U,, k=1,2,...,7, unde y reprezintă 
mulţimea tuturor situaţiilor care ar putea să apară în cea de a k-a ocazie de 
măsurare. 


De exemplu, la upa atita a unui chestionar persoanele ar putea . 


fi "obosite", "plictisite" sau "nervoase". 

Mulţimile U,, 4=1,2,...,n nu sunt cunoscute, aint se presupune ca ele 
există. 

Cu alte cuvinte, spre deosebire de teoria clasică a testelor, unde sunt 
măsurate persoanele, în teoria stărilor şi a trăsăturilor sunt măsurate persoanele 
în situaţii. l 

Pentru fiecare ocazie de măsurare, k=1,2,...,.n, se notează cu M, 
mulțimea rezultatelor posibile. De exemplu, dacă se administrează de n=3 ori 
un chestionar format din patru itemi ale căror răspunsuri posibile sunt (în 
paranteză, după fiecare răspuns, este notat scorul oaa 
e pentru itemul 1 : "da" (1), "nu" (0); 

o pentru itemul 2 : "rar" (-1), "uneori"(0), "adesea" (1); 
e pentru itemul 3 : "adevărat" (1), "fals" (0); 
e pentru itemul 4 : "putin" (-1), "potrivit" (0), "mult" (1) 
atunci - y | | 
M; =M,=M,= {"da","nu"} x. 
{"rar","uneori","adesea"} x 
{"adevarat", "fals"} x 
- {"puțin"," potrivit", "mult" }. 

Un element al mulțimii M, (un răspuns la prima ocazie de măsurare) 

poate fi fi, de pildă, ("da", “uneori","fals","mult"). 
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Deci, rezultatele posibile ale experimentelor aleatoare considerate in 

teoria stărilor şi a trăsăturilor formează produsul cartezian 
| Z = P x (U,xUpx...U,) x (M)xMbx...xM,) 
Fiecare element al său, (p,u },Ut3,...,tpp Mm DM3... M,)EZ este constituit din: 

e o persoană peP; 

e n situaţii în care au fost efectuate măsurările (4, situaţia apărută la 

cea de a k-a măsurare, 4=1,2,....n); | 

e n rezultate de măsurări (m,=rezultatul măsurării k, k=1,2.,...,n, care 

este format din rezultatele răspunsurilor la itemii componenti ai 

chestionarului). . 

De exemplu, în cazul considerat mai sus, când acelaşi chestionar format 
din patru itemi a fost administrat de trei ori, un elemental mulțimii Z poate fi: 
(Ionescu, "obosit", "bolnav", "bine dispus", "da", "rar", "adevărat", "puțin", 
"da", "uneori", "adevărat", "puțin", "nu", "rar", "fals", "potrivit") 

Deci, persoana "Ionescu", la a doua ocazie de măsurare a fost "bolnavă" 
şi a răspuns la cei patru itemi ai chestionarului cu "da", "uneori","adevărat" şi 
"puțin". 


Se consideră operatorii: | 
Po: Z->P care ia ca valori persoanele din P; 
Py: Z -> U, care ia ca valori situațiile posibile la măsurarea efectuată în 

: ocazia k, k=1,2,...,n. | 

Se presupune că la fiecare ocazie k, k=1,2,...,.N, se măsoară m, itemi. 

În fiecare ocazie de măsurare k, k=1,2,...,.n, pentru fiecare item J 
administrat, j=1,2,...,2,, se consideră variabila "scor observat", Yx care are ca 
valori scorurile care se pot obţine în populaţia P, la itemul J, în cea de a k-a 
„ocazie de măsurare: | 

4 Yn: Z->R 

In exemplul de mai sus, variabila Y}, asociată celui de-al treilea item 
al chestionarului la cea de a doua administrare, poate lua valorile 1 (pentru 
răspunsul "adevarat") şi O (pentru răspunsul "fals"), 

Fiecare variabilă- Y, este o variabilă aleatoare. Ea ia valorile posibile cu 


anumite probabilitati. 


Se definesc, pentru: 
e fiecare persoană peP; 
e fiecare măsurătoare k, k=1,2,...,n 
e fiecare situaţie posibilă u,eU, în ocazia de măsurare k; 
e fiecare item j, j=1,2,....m, 
variabilele aleatoare 
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M(Yx| pp, pu) (6.3.3.3) 


i ek = Ya a Tik a (6.3.3.4) 
r = M(Yix| pop) (6.3.9 
Ci = Tk Ss A l (6.3.3.6) 
T se numeşte "variabila stare latentă". Ea reprezintă media tuturor 
scorurilor pe care le-ar putea obține persoana p, la itemul j, in situația 
Uy. 
Cn este "eroarea" de măsurare pentru persoana p, la eit J, în situaţia u. 


Fiind diferenţa dintre scorul obţinut şi "starea latentă”, această variabilă 
se referă de fapt la eroarea de măsurare a stării latente. 

oi se numeşte "variabila trăsătură latentă". Ea este media tuturor 
scorurilor pe care persoana p le-ar putea obţine la itemul j, la cea de a 

_ k-a administrare a chestionarului, dacă se iau în considerare toate 

situaţiile în care s-ar putea afla atunci persoana p. 

Gx este "reziduul stării latente”. Ea este diferenţa dintre starea latentă $i 
trăsătura latentă. 


Se observă că toate variabilele (Tis Ses Sito €x) au fost definite relativ la 
variabila observată Y. 

Din definiţia variabilei q, (6.3.3.3), rezultă că o variabilă stare latentă 
caracterizează o persoană p, într-o situafie de măsurare u,. Fiecare persoană 
într-o situaţie de măsurare are un scor 7 Şi numai unul. 

După cum rezultă din HEA variabilei 4, (6.3.3. 5), variabila - 
trăsătură latentă caracterizează o persoană p. eect persoane fi este atribuit 
un scor &, şi numai unul. 

Definiţia variabilei ¢4, (6.3.3.6), arată că reziduul stării latente 
caracterizează persoana p într-o situaţie u, deoarece fiecărei perechi (p, 14) fi 
este atribuit un scor ¢ şi numai unul. 


6.3.4. Modelul de bază al teoriei stărilor si a RELA latente 


Relais (6.3.3.6), transcrisă sub forma 
= but oy | (6.3.4.1) 
arata ca a orice persoană peP şi orice situaţie z,cU,, k=1,2,...,n, variabila 
stare latentă 7, este compusă dintr-o variabilă trăsătură latentă y ik şi! un reziduu 
al stării Tarente, Cie 
Relația 6 3.3.4) poate fi aea astfel: . 
Vig = Det Oe - (6.3.4.2) 
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Ecuațiile (6.3.4.1) şi (6.3.4.2) constituie modelul matematic al teoriei 
stărilor şi al trăsăturilor latente. El exprimă ideea de bază a acestei teorii, şi 
anume: atributele manifeste (variabilele observate) au 

e o componentă eroare 
și 
l e o componentă stare latentă, care constă din 
e o componentă trăsătură latentă 
2 e un reziduu care depinde de situația prezentă cu 

ocazia măsurării şi/sau -de interacţiunile dintre 
persoană si situaţie. 


6.3.5. Coeficientii utilizaţi de teoria stărilor şi a trăsăturilor latente 
Definiţiile variabilelor latente To Se» & Size implică, fără nici o 


presupunere suplimentară asupra variabilelor, aditivitatea variantelor 
corespunzătoare : 


P(Y) = PCy) + Pep) (6.3.5.1) 
F(T) = T(E) + la) (6.3.5.2) 
In ipoteza ca variabila Y, are mai multe valori, deci P(Y, )>0, se pot 


defini urmatorii coeficienti (Deinzer, Steyer ş.a., 1995): 
e coeficientul de fidelitate: 


a) 
0°(¥,,) 


Rel(Y,)= (6.3.5.3) 


Acesta reprezintă partea din varianţa variabilei observate Y, datorată 
variabilei stare latentă. El arată, la fel ca şi în teoria clasică a testelor, 
cât de precisă este: măsurătoarea (în cazul de faţă, cât de precis este 
măsurată starea latentă). 

e coeficientul de consistenţă: 


0“(6,)» | 
WENS RS (6.3.5.4) 


Acesta reprezintă partea din varianta variabilei Y, datorată numai 
individului, nu şi situaţiei sau interacțiunii persoanei cu situaţia. 
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e coeficientul de specificitate a ocaziei: 
oC.) 


> (6.3 S55) 
GAY) 


Spe(Y,)= 


El reprezintă partea din varianta variabilei Y, datorata situatiei sau 

interactiunii persoanei cu situatia. 

Din relatia (6.3.5.2) rezulta: | 

Rel(Y,) = Con(Y,) + Spe(Y,). | (6.3.5.6) 

Deci, un instrument de măsură este precis, dacă valorile înregistrate de 
el (scorurile observate) surprind atât trăsătura psihică a persoanei, cât şi 
influenţa situaţiei de măsurare asupra acesteia. 

„Dacă o variabilă observată Y, este puternic influenţată de situaţie şi 
dacă trăsătura persoanei considerate are doar o mică importanţă, atunci 
coeficientul de specificitate a ocaziei va fi mare şi coeficientul de consistenţă va 
fi mic. Din contră, un coeficient de consistenţă mare şi un coeficient de 
specificitate a ocaziei mic arată că variabila observată este influenţată în 
principal de caracteristicile individului şi că situaţia şi/sau interacţiunea 
persoanei cu situaţia nu are o importanţă prea mare. 
| Trebuie remarcat că cei trei coeficienţi definiti mai sus se referă nu la 
un test (precum coeficientul de fidelitate în cazul teoriei clasice a testelor), ci la 
un item de test aplicat unei persoane, într-o anumită situaţie. 


6.3.6. Câteva modele ale teoriei stărilor şi a trăsăturilor latente 


Ne vom referi în continuare doar la cazul în care se măsoară o singură 
variabilă trăsătură latentă, prin cel puţin doi itemi, fiecare administrat în două 
sau mai multe ocazii. Vom prezenta ipotezele utilizate de trei modele (Steyer, 
“Schmitt, 1992). 

A. Modelul cu o singură trăsătură (singletrait model) nu face nici o 
distincţie între stări şi trăsături, adică se presupune că fiecare variabilă stare 
latentă este identică cu variabila trăsătură latentă care intră în compunerea ei. 
Deci nu apar efectele ocaziei. E 

Fiecare variabilă observată Y, are asociată o variabilă trăsătură latentă, 
bye In acest caz, variabilele éx au acelaşi statut ca şi variabilele "scor real" din 
teoria clasică a testelor. Variabila trăsătură latentă comună, & este definită ca o 
funcție liniară de variabilele &;. | 
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B. Modelul cu mai multe stări (multistate model) ia în considerare 
şi specificitatea situaţiei. Fiecare variabilă observată, Y, este determinată de 
două tipuri de influenţe: | 

e o variabilă stare latentă, comună tuturor situaţiilor de măsurare în 
ocazia tip Tg 

e o variabilă eroare, ejt 

Acest model nu se ocupă decât de stările latente, nu si de trăsăturile 
latente. Fiecărei variabile observate Y li este asociată o variabilă de stare latentă 
Tx iar variabila stare latentă comună 4, este definită ca o funcție liniară de 
variabilele Tit 

In acest caz, variabilele stare latentă T au acelaşi Statut ca şi variabilele 


"scor real" din teoria clasică a testelor. 


C. Modelul 'cu o singură trăsătură şi mai multe stări (multistate- 
singletrait model), la fel ca şi modelul cu mai multe Stări, nu se interesează de 
variabila trăsătură latenţă, ceea ce înseamnă că nu permite descompunerea 
variantei stării latente A trăsăturii latente şi in varianta reziduului stării 
latente. | 

Se presupune că pentru fiecare ocazie de măsurare u, există o variabilă 
stare latentă comună tuturor itemilor, z, si că toate variabilele T, au O trăsătură 
latentă comună, £ 


CAPITOLUL 7 
SURSE DE EROARE IN TESTAREA PSIHOLOGICĂ 


7.1. NOŢIUNEA DE EROARE | 


“Termenul eroare înglobează tot ceea ce scade precizia testului, prin 
precizie înțelegând gradul în care răspunsurile date de subiect sunt predictive 
“pentru o anumită trăsătură ori pentru un anumit comportament (Most, 1987). 

Eroarea este rezultatul acţiunii unor factori care influenţează măsurarea 
- într-un asemenea mod încât nu pot fi nici recunoscuţi, nici intelesi. Ea afectează 
scorurile obţinute la test de subiect şi/sau interpretarea dată acestora. 
| Existenţa erorii (nu şi mărimea ei) este pusă în evidenţă atunci când 
rezultatele testului sunt folosite pentru a se face predicții asupra comporta- 
mentului şi când se constată că numai o parte dintre pledictii se adeveresc. 


Teds FACTORI CARE INFLUENTEAZA REZULTATELE 
TESTĂRII PSIHOLOGICE 


Scorul obţinut de o persoană la un test psihologic administrat într-o 
ocazie particulară este rezultatul acţiunii unor factori diverşi. Pe de-o parte, 
scorul este influenţat de variabila pe care testul trebuie să o măsoare. Aceasta 
poate fi o caracteristică stabilă a persoanei (o îrăsătură) sau o caracteristică 
dependentă de situaţie (0 stare). Pe de altă parte, însă, scorul este determinat şi 
de numeroşi factori care acţionează ca agenţi EL (ui balon Unii dintre ei au 
legătură cu: 

e diverse caracteristici stabile ale persoanei, alee decât cea măsurată 

de test; 

e caracteristicile situaţiei în care are loc testarea; 

. © caracteristicile testului folosit: tipul itemilor (cu răspunsuri de tip 
"da"/"nu", cu alegere multiplă etc.), modul de administrare a testului 
(creion-hârtie, cu ajutorul calculatorului etc.), sarcina impusă de test 
etc. y i | 

iar alţii sunt aleatori. Aceşti factori perturbatori ar putea fi grupaţi astfel 
: (Anastasi, 1976; E. L. Thorndike, după Murphy şi Davidshofer, 1987; Jäger,- 
1993): 
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A. caracteristici durabile ale persoanei, independente de situa fia de testare si 
care au influenţă asupra modului de rezolvare a testelor psihologice în 
general, nu numai a testului în cauză: 

e abilitatea generală de a înţelege instrucţiunile testelor (persoanele cu 
un nivel intelectual redus vor avea dificultăţi în a înţelege ce au de făcut); 

e deprinderi şi îndemânări generale pentru rezolvarea testelor 
(persoanele pasionate de rezolvarea diverselor teste întâlnite în reviste se vor 
descurca mai uşor şi mai rapid cu un test particular); 

e unele deprinderi care pot influenţa modul de a rezolva un grup de 
teste care prezintă asemănări cu testul în cauză (de exemplu, un vânzător care 
are şi sarcina de a încasa banii pentru marfa vândută, deci de a calcula rapid 
costul total şi restul, poate fi avantajat la rezolvarea unor teste care conţin şi 
calcule aritmetice simple, indiferent dacă aceste teste sunt destinate măsurării 
inteligenţei, a aptitudinii matematice sau a deprinderii de a efectua calcule); 


B. caracteristici durabile ale persoanei, independente de situaţia de testare si 
care au influenţă asupra modului de rezolvare a testului respectiv, dar nu si 
a altor teste: 

e cunoştinţe şi deprinderi care pot influenţa modul de rezolvare a 

testului în cauză (de exemplu, la un test de creativitate care cere să se 

completeze cât mai multe cuvinte într-un interval de timp dat vor fi avantajate 

persoanele pasionate de rezolvarea integramelor); | A 

e existenţa unor patterne de răspuns stabile (de exemplu, tendinţa 
subiectului de a marca prima opţiune, mai des decât altele, într-un test cu 
alegere multiplă sau tendinţa de a răspunde "adevărat", atunci când nu este sigur 
care dintre răspunsurile "adevărat" şi "fals" i se potriveşte mai bine); 

e cunoaşterea de către subiect a răspunsului la unii itemi (de exemplu, 
subiectul cunoaşte un fapt particular cerut de un item dintr-un test de cunoştinţe 
sau ştie la ce se referă un item dintr-un chestionar de personalitate şi cum trebuie 
să răspundă pentru a crea despre sine imaginea pe care o doreşte); i 


C. factori care acfionează diferit de la o situaţie de testare la alta si care au 
influenţă asupra modului de rezolvare de către subiect a mai multor teste 
psihologic administrate în situaţia respectivă, nu numai a testului în cauză: 

e caracteristici temporare ale persoanei: starea fizică şi psihică generală 
(starea de sănătate, oboseala, motivaţia, tensiunea emoţională), experienţa 
anterioară în domeniul testării psihologice, acceptarea necesităţii testării; 

e condiţiile fizice în care are loc administrarea testului: căldura, lumina, 
ventilatia etc.; 
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e comportarea examinatorului şi interacţiunea personalităţii, a sexului 
sau a rasei examinatorului cu subiectul; i 
D. factori care acfionează diferit de la o situaţie de testare la alta şi care au 
influenţă asupra modului de rezolvare de către subiect a testului în cauză, dar 
nu şi a altor teste care măsoară aceeaşi caracteristică: 

e nivelul de antrenare al subiectului în rezolvarea unor sarcini ase- 
mănătoare celei cerute de testul în cauză (de exemplu, la un test de dexteritate 
manuală care cere parcurgerea unui labirint, o persoană care în zilele precedente 
testării a efectuat mai multe exerciţii de acest fel are şanse să obţină un punctaj 
mare); | ani 
e dispoziţia momentană a subiectului pentru rezolvarea testului în 
cauză (de exemplu, unei persoane foarte ocupate în ziua testării i se va părea 
prea lung un chestionar de personalitate cu mulţi itemi, precum CPI, şi .s-ar 
putea să răspundă la întâmplare ori de câte ori nu este sigură de răspunsul care 
i se potriveşte); i A 

e fluctuații ale memoriei sau ale atenţiei subiectului în timpul testării, 
care îl fac să nu îşi amintească la moment un anumit fapt sau să nu observe 
unele amănunte; 


E. factori cu acţiune aleatoare, care afectează administrarea testului în cauză 
' sau aprecierea performan felor la test, şi care ar putea sau nu să influențeze 
rezultatele altor teste administrate în aceeaşi situaţie: 
3 e factori de distragere a atenției subiectului (de exemplu, un zgomot 
puternic produs în timpul testării); 
e norocul la ghicirea răspunsului corect, atunci când subiectul alege 
- răspunsul la întâmplare; | i 
e cotarea greşită a unor itemi, intenționată sau nu, şi, în consecință, 
obţinerea unui scor eronat. | 


` F. factori legaţi de concepția testului în cauză, independen fi de subiect şi de 
situaţia de examinare: structura testului, compoziţia şi repartiţia itemilor etc. 


Vom analiza, în continuare, câteva dintre cauzele erorilor de măsurare 
în testările psihologice. 


Ambianja în care are loc administrarea testelor psihologice, chiar daca - 


nu este apreciată drept nesatisfăcătoare de majoritatea celor examinati, pentru 
unele persoane poate genera nemulțumiri şi poate astfel influenţa rezultatele. 
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Davidsen şi Maxey (1993) au efectuat un studiu pe un lot de 27631 
studenţi, în scopul identificării legăturilor dintre diverse caracteristici de 
personalitate şi gradul de nemulţumire faţă de câteva condiţii de testare: 
"luminozitatea încăperii, nivelul de zgomot, dimensiunile suprafeţei de scris şi 
distanţa dintre scaune. Principalele constatări pot fi sintetizate astfel: 

e Fiecare dintre aceste condiţii a fost considerată multumitoare de cel 
putin 89% dintre studenti, pentru ambele sexe. 

e S-a putut observa o creştere a nemulțumirii faţă de toate cele patru 
condiţii de testare pe măsură ce creşte nivelul de aspirație academică. 

e În cadrul unor loturi de studenţi cu aceeaşi pregătire şcolară, cei care 
au cele mai bune rezultate şcolare sunt cei mai nemulţumiţi de mărimea 
suprafeţei de scris şi de nivelul de zgomot. 


Situaţiile de evaluare sunt surse de tensiune şi de anxietate. Anxietatea 
_ fafa de test este un concept binecunoscut. Se ştie că acest fel de anxietate creşte 
» pe măsură ce creşte importanţa atribuită de subiect evaluării şi cadrului în care 
se face testarea (Benziman, Toder, 1993). Există studii care arată că dacă 
anxietatea faţă de test are un nivel uşor mărit, poate creşte motivaţia şi, astfel, 
se poate îmbunătăţi performanţa, în timp ce un nivel ridicat al anxietatii fata de 
test afectează motivaţia. | 

Anxietatea este cauzată în mare măsură de ambiguitatea testului, de 
faptul că subiectul simte că nu poate afla ce se aşteaptă de la el şi de teama că 
rezultatele testării nu vor fi secrete (Benziman, Toder, 1993). 


Lipsa de interes, oboseala sau starea de boală îl pot determina pe 
subiect să răspundă la întâmplare. O posibilitate de depistare a unor asemenea 
situaţii, în cazul chestionarelor de personalitate, o constituie introducerea, în 
test, a unor scale de identificare a inconsistentei răspunsurilor, de forma celor 
construite de A. Tellegen (Ozer, Reise, 1994): 

e Scala VRIN (variable response inconsistency) constă din perechi de 
itemi care sunt similari semantic şi la care subiecţii ar trebui să răspundă în 
acelaşi sens. 

e Scala TRIN (true response inconsistency) conţine perechi de itemi 
care sunt similari semantic dar cotati în direcţii opuse. Ea depistează persoanele 
care răspund la toţi itemii la fel ("adevarat" sau "fals"), fără a fi atente la 
conţinutul lor. 


Gradul de concordanţă a intereselor persoanelor exam inate cu cele ale 


examinatorului are influenţă asupra comportării subiecţilor în timpul testării. 
Astfel: 
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e dacă atât subiectul cât şi psihologul sunt interesaţi în stabilirea unui 
diagnostic corect, este de aşteptat ca motivaţia subiectului să fie ridicată; 

e dacă testarea a fost cerută de o autoritate externă, este posibil ca 
motivaţia subiectului să fie scăzută; 

e dacă testarea se face în cadrul unei cercetări, iar subiecţii sunt 
voluntari, motivaţia poate varia foarte mult.de la o persoană la alta j “ger, 
1993); 

Motivația influenţează atitudinea persoanelor examinate Si, deci, 
raspunsurile la test. 


În cazul utilizării chestionarelor de personalitate, confinutul si forma 
itemilor testului pot constitui surse de eroare. Amintim câteva defecte posibile 

„ale itemilor (Angleitner, John, Löhr, 1986; Fife-Schaw, 1995): 

a. Itemul nu este înţeles de subiecţi. Aceasta se întâmplă dacă sunt 
utilizate cuvinte neobişnuite, neologisme, fraze lungi, neclare sau dacă există 
erori gramaticale. i 

b. Itemul este ambiguu, el poate fi interpretat in mai multe feluri. 
Asemenea situaţii apar atunci când itemul conţine cuvinte sau expresii cu mai 
multe sensuri sau când există incompatibilitati între item şi formatul răspunsului 
poses De exemplu, multi itemi fac referire la ceva care se petrece "frecvent" sau 

'. Or, înţelesul acordat acestor termeni diferă de la o persoană la alta. În 
urma unui experiment care le-a cerut mai multor persoane să indice cât de des 
trebuie să apară un eveniment, fata de numărul total de apariţii posibile, pentru 
ca ele să îl considere ca fiind "frecvent", s-a constatat că un sfert dintre subiecţi 
au indicat cu procent mai mic decât 40%, i iar un sfert, un procent mai mare decât 
80% (Mischel, 1968). . : 

c. Itemul îi cere subiectului să evalueze şi să generalizeze, nu să ri 
un comportament particular (de exemplu, în CPI: "L-am privit pe tatăl meu ca 
fiind omul ideal" sau "Simt o puternică dorinţă de a reuşi în viață"). În asemenea 
situaţii, răspunsurile sunt mai relevante pentru interpretarea dată de subiect 
itemului decât pentru comportamentul său în situaţii non-test (Mischel, 1968). 

d. Itemul cere o informaţie abstractă, de exemplu face referire la o 
dispoziţie sau o atitudine generală şi nu la un comportament sau la o situaţie 
concretă. Cu cât itemul este mai abstract, cu atât vor exista mai multe deosebiri - 
între persoanele examinate în privinţa modului în care îl înţeleg. 

ca e. Întrebările sugerează răspunsul. De exemplu, itemul "Sunteţi de acord 
"că politica guvernului în domeniul învăţământului este greşită?" sugerează 
L răspunsul afirmativ. | 

f. Itemul nu este potrivit populaţiei căreia îi este destinat testul. De 

exemplu, întrebarea "Câte pahare de bere aţi băut săptămâna trecută ?" , adresată 
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unor persoane cu probleme de sănătate, va primi de la majoritatea subiecţilor 
răspunsul "0". 

g. Itemul conţine două întrebări sau afirmaţii. Persoana pentru care una 

dintre ele are valoare de adevăr iar cealaltă de fals va răspunde, probabil, la 
întâmplare. De exemplu, la întrebarea "Consideraţi că programul de instruire pe 
care l-aţi urmat a fost bun şi eficient pentru dumneavoastră ?" pot să apară două 
situaţii la care este dificil de dat un răspuns: programul a fost bun, dar ineficient 
pentru subiect sau programul a fost de slabă calitate, dar pentru persoana 
examinată a fost eficient. 

h. Itemul conţine presupuneri implicite. De exemplu, întrebarea "Cât . 
durează certurile cu soful/sotia dumneavoastră?" face ipoteza că subiectul este 
căsătorit şi că se ceartă cu sotul/sotia. | 

i. Itemul este astfel formulat încât unul dintre răspunsurile posibile îl 
pun pe subiect într-o lumină negativă. Dorinţa de a face o impresie bună îl va 
determina să evite acest răspuns, chiar dacă el reflectă o situaţie reală. 

j. Prin conţinutul său, itemul deranjează persoanele examinate. Aceasta 
se întâmplă, de obicei, când întrebările se referă la apartenenţa religioasă sau 
politică a subiectului. 


` ` 

În mod obişnuit, unui test psihologic i se cere să aibă validitate de 
aspect, pentru a creşte motivaţia subiecților la completarea lui. Frecvent, adulții 
refuză să răspundă la un test care li se pare absurd sau ridicol ori răspund la ` 
întâmplare. Din acest motiv, absenja validității de aspect constituie uneori o 
sursă de eroare pentru scorul testului. 

Alteori, însă, tocmai prezenţa validității de aspect conduce Ja 
denaturarea scorurilor testului. Explicaţia o constituie faptul că testele care au 
validitate de aspect le permit subiecţilor să ghicească ce măsoară ele. Pentru 
testele de aptitudini, aceasta nu are importanţă: chiar dacă subiectul ştie că un 
item măsoară inteligenţa, felul în care va răspunde la el nu se schimbă. Nu 
acelaşi lucru se întâmplă în cazul testelor de personalitate. De exemplu, la 
selecţia profesională a poliţiştilor, doar puţine persoane anxioase vor răspunde 
sincer la un test care măsoară anxietatea şi are validitate de aspect. 


CAPITOLUL 3 
FIDELITATEA TESTELOR PSIHOLOGICE 


8.1 DEFINIŢIA FIDELITATII TESTELOR 


În vorbirea curentă, cuvântul "fidel" este folosit pentru a descrie 
constanta (sentimentelor), durabilitatea (ataşamentului), exactitatea (memoriei) - 
sau, în cazul unui instrument de măsură, proprietatea acestuia de a arăta aceeaşi 
valoare când se repetă măsurarea (Le petit Larousse, 1993). 

_ În teoria testelor, conceptul de fidelitate a cunoscut diverse acceptiuni 
pe parcursul timpului. Dacă in 1954 şi în 1966, Standards for Educational and 
Psychological Tests intelegeau prin fidelitate "precizia -consistenta si 
stabilitatea- măsurării realizate de test", în 1974 fidelitatea este privită ca şi 
"gradul în care rezultatele testării pot fi atribuite surselor sistematice de variaţie" 
: (Standards for Educational and Psychological Tests, 1974). 

Termenii de "consistență" şi "stabilitate" continuă să fie utilizaţi, în 
legătură cu fidelitatea testelor, având sensul de repetabilitate a rezultatelor 
măsurării. Astfel, ultimele Standards for Educational and Psychological Tests, 
cele din 1985, definesc fidelitatea ca fiind "gradul in care scorurile testului sunt 
consistente sau repetabile, adică gradul în care ele nu sunt afectate de erorile de 
măsură". 

În unele definiţii, prin fidelitate se înţelege "precizia măsurării" realizate 
de un instrument. Trebuie nienţionat, însă, că termenul de "precizie" (accuracy) 
apare în literatura psihologică în diverse acceptiuni. De exemplu (Silva, 1993): 

e R. G. Lord îl utilizează ca sinonim pentru "fidelitate"; 

e I. Delclaux şi M. R. Martinez Arias consideră că el se referă la 
mărimea erorii standard de măsură; l 

e J. M. Johnston şi H. S. Pennypacker îl folosesc pentru a desemna 
gradul în care valorile obținute prin măsurare aproximează starea reală din 
natură; 

e A. E. Kazdin îl inteipretează ca fiind gradul în care o înregistrare 
făcută cu un instrument de măsură se potriveşte cu mărimea unui criteriu 
prestabilit referitor la aceleaşi date. 


În continuare vom urmări definiţia fidelității în termeni matematici, în - 
teoria clasică a testelor. 

Se notează cu M o mulţime de teste şi cu P o mulţime de persoane. Se 
alege un test meM, care se aplică tuturor persoanelor din P. 
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Conform definiţiei formulate în paragraful 6.1.1, coeficientul de 
fidelitate al testului m. este pătratul coeficientului de corelaţie liniară între 
scorurile reale şi scorurile observate la test, P(X, ATR. EI verifică relaţia 


6.1.1.23: 


o(T. 
p? P iie ies 4 ( i 
as 6, daly 


Fiind pătratul unui coeficient de corelaţie, coeficientul de fidelitate este 
„cuprins întotdeauna între 0 şil. i 
Formula de definiție a coeficientului de fidelitate se poate rescrie, 
folosind relația 6.1.1.22, astfel: 
| oE) 


m* 


2 T 4 
P AmoT mi) l Y ) 49.131) 


m* 


De aici se deduc următoarele: 


A. Coeficientul de fidelitate este egal cu 1 dacă şi numai dacă eroarea standard 
de măsură 0;=0(E,,+) este nulă. Deoarece media erorilor de măsură M(£,+) este 
nulă, dispersia erorilor de măsură poate fi egală cu zero numai dacă toate erorile 
de măsură sunt nule. Deci, un test are coeficientul de fidelitate egal cu unu dacă 
şi numai dacă scorurile observate coincid cu scorurile reale, adică dacă testul 
este o măsură foarte precisă. 


B. Coeficientul de fidelitate este egal cu zero dacă şi numai dacă are loc 
F ow . . . 
o(T,,»)=0, adică toate persoanele din populaţia P au acelaşi scor real. 


Dacă aeM şi beM sunt două instrumente de măsură paralele şi dacă 
pentru orice persoană peP scorurile observate Xap $i Au, (sau, echivalent, erorile 
de măsură E, şi Kp) sunt variabile aleatoare independente, atunci, conform 


teoremei 6.1.2.3, coeficientul de fidelitate poate fi calculat cu formula 6.1.2.13: 


OX Ta.) = P(X Xp.) 


De aici rezultă că un test poate avea coeficientul de fidelitate egal cu 
unu dacă şi numai dacă X,.=X,, 
In concluzie, putem spune, că un test este fidel atunci când: 
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e este precis (lipsit de erori de lemăzură) 
sau, echivalent, 

e orice persoană obţine scoruri egale la test şi la o formă Date a 
„acestuia, condiţiile de administrare fiind stabilite astfel încât erorile de măsură 
la cele două teste, pentru orice persoană peP, să fie independente. 

În studiul fidelității se presupune că erorile de măsură sunt aleatoare Şi 
nu sistematice. O eroare este sistematică dacă afectează în acelaşi mod valoarea 
observată, la fiecare măsurare. De exemplu, dacă pentru aprecierea performan- 
telor unor operatori se numără greşelile efectuate de aceştia la introducerea unui 
text în calculator şi una dintre taste este defectă, atunci caracterul respectiv va 
apărea pentru. toţi subiecţii ca fiind tastat greşit. Această eroare va fi prezentă în 
toate măsurătorile efectuate. Ea este o eroare sistematică. 

Teoria referitoare la fidelitatea testelor consideră că erorile de măsură 
sunt complet impredictibile, indiferent de cunoştinţele pe care le avem despre 
persoanele măsurate sau despre procesul de măsurare. Înainte de a calcula 
coeficientul de fidelitate al unui test este absolut necesar să se precizeze ce 
reprezintă scorurile reale ale testului. Aceasta, deoarece o anumită caracteristică 
a unei persoane poate fi măsurată prin scorurile reale ale unui test sau poate 
influenţa scorurile observate, ca eroare de măsură, la un alt test. 

Să considerăm un test de cunoştinţe de fizică administrat cu ajutorul 
calculatorului. În acest caz, lipsa deprinderii de a lucra la calculator şi anxietatea 
fata de calculator acţionează ca şi factori perturbatori, mărind erorile de măsură. 
Influenţa lor va fi mai puternică la elevii unei clase cu profil umanist decât la cei 
dintr-o clasă de informatică. Dacă acelaşi test este administrat în varianta creion-. 
hârtie, factorii menţionaţi nu vor mai avea nici un rol. 

Se deduce, de aici, că pentru a arăta cât de bine sunt reflectate scorurile 
“reale ale unui test de către scorurile observate nu este suficient să se indice o 
valoare a coeficientului de fidelitate, ci trebuie să se precizeze: 

e caracteristicile persoanelor care au răspuns la test (nivel de studii, 

vârstă etc.); i 

© condițiile in care a fost administrat testul. 

Deci, nu se vorbeşte despre fidelitatea unui instrument de. măsură, ci 
despre fidelitatea acelui test aplicat la o anumită populaţie şi în anumite condiţii. 


8.2. ROLUL COEFICIENTULUI DE FIDELITATE. 


Coeficientul de fidelitate e la aprecierea preciziei unui test, dar 
nu este suficient pentru descrierea acestuia ca instrument de măsură. O aceeaşi 
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valoare a coeficientului de fidelitate poate fi obţinută pentru dispersii diferite ale 
scorurilor observate şi ale erorilor de măsură. Coeficientul de fidelitate reflectă 
doar mărimea raportului celor două dispersii. Din această cauză, Standards for 
_ Educational and Psychological Tests din 1985 recomandă ca în manualul testu- 
lui să figureze, alături de coeficientul de fidelitate al testului, eroarea standard 
_ de măsură, Op. 

Coeficientii de fidelitate se utilizează la compararea testelor. Eroarea 
standard de măsură serveşte la interpretarea scorurilor testului, mai precis, la 
determinarea intervalelor de încredere pentru scorurile reale ale subiecţilor. 

Raționamentul care stă la baza procedurii de estimare a intervalului de 
încredere pentru scorul real al unui subiect este identic cu cel utilizat în statistică 
pentru estimarea intervalului de încredere al mediei populaţiei (Traub, 1994). 
Se presupune că valorile variabilei Ap pentru persoana peP, la testul meM, sunt 
repartizate normal, cu media Tp Şi cu abaterea standard Of, ). Cunoscând 
Valoarea unui scor observat pentru persoana Ps Xp Şi considerând valoarea 
OL») egală cu eroarea standard de măsură în populaţia P,,o , intervalul de 
încredere al scorului real, corespunzător unei probabilităţi de 0.68, este 

Sop Of: Xmpt Oz); 
iar cel corespunzător unei probabilitati de 0.95 este 

(mp 1.96 Op, Xp +1.96 04) 

Eroarea standard se calculează cu ajutorul coeficientului de fidelitate şi 
al abaterii standard a scorurilor observate: | 


m?" mx 


0, = 0(%,,) 1-p2(X T ) TCRA 


In raportul psihologic întocmit pentru persoana p, alături de scorul 
obținut de aceasta la test, xp» se va indica şi intervalul de încredere al scorului 
real. 


O altă utilizare a coeficienţilor de fidelitate o constituie calculul 
coeficientului de corelaţie liniară între scorurile reale ale subiecţilor la două 
teste, în scopul studierii asemănării constructelor măsurate de acestea. Notând 
cu a şi b cele două teste, se aplică următoarea formulă (Perugini, Gallucci, 
1979); 


iri PX X;.) | 
PENS Ta) ae ae (8.2.2) 


p? ALB T P(X). Tp.) 
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unde: 


XP Bee) este coeficientul de corelaţie liniară între scorurile reale la cele 
două teste; 
MĂ ara Xp) este coeficientul de EES liniara intre scorurile observate la 


cele doua teste; 
[40.9 Ta) şi ; 
PX FS) sunt coeficientii de fidelitate ai testelor. 

Din această formulă se-observa că totdeauna coeficientul de corelaţie 
liniară între scorurile observate la teste, în valoare absolută, este mai mic sau cel 
mult egal cu valoarea absolută a coeficientului de corelaţie liniară între scorurile 
reale ale testelor. 


8.3. FORMULE DE CALCUL UTILIZATE PENTRU 
EVALUAREA FIDELITATII 


` Întrucât repartitiile variabilelor aleatoare Ama Tms ŞI E» pentru un test 
m nu u pot fi cunoscute, coeficientul său de fidelitate nu poate fi calculat pe baza 
formulei de definiţie (6.1.1.23). Unele metode de testare psihologică (metoda 
test-retest, metoda formelor paralele) aplică formula 6.1.2.13. Dar aceasta nu 
furnizează decât o valoare aproximativă, deoarece este imposibil de stabilit dacă 
două teste sunt cu adevărat paralele. În această situaţie, se obişnuieşte să se | 
estimeze coeficientul de fidelitate folosindu-se diverse formule care, în anumite 
condiţii, acceptabile din punct.de vedere teoretic (dar a căror îndeplinire nu 
poate fi probată în practică), furnizează valori egale cu coeficientul de fidelitate. 
Considerăm că un coeficient este convenabil pentru estimarea fidelității 

unui test psihologic dacă îndeplineşte următoarele condiţii (Albu, 1990): 

a. este cuprins în intervalul [0,1], la fel ca şi coeficientul de 

fidelitate; 

_b. are o valoare apropiată de cea a coeficientului de fidelitate; 

c. are o comportare consecventă față de coeficientul de 

„ fidelitate, adică este permanent mai mare sau permanent mai | 
mic decât acesta; 

- d. poate fi calculat cu uşurinţă, fără a pretinde experimente 
suplimentare. 

Vom urmări aceste aspecte la câţiva coeficienţi care se 
utilizează în practică pentru testele formate din n părţi (itemi sau 
grupe de itemi), n22, atunci când scorul observat al testului se obține 
prin însumarea scorurilor observate ale părţilor componente: 
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X=¥,+¥,+..4¥, 


unde 
-X este variabila aleatoare corespunzătoare scorurilor observate 
la întregul test; 
Y, este variabila aleatoare corespunzătoare scorurilor observate 


„la cea de-a i-a parte a testului, 12, 37, 
Aceşti coeficienţi sunt: | 
e coeficientul @ al lui Cronbach (Cronbach, 1943): 


oy) AA (8.3.1) 


e coeficientul A; al lui Guttman (Lord, Novick, 1968): 
In ambele formule: 


_ i=l 


A3=1 zi 
Oy 
0, =0°(X) este dispersia scorurilor observate ale 
„testului; 
0j=0%(Y;) reprezintă dispersia scorurilor observate la 
cea de-a i-a parte a testului, pentru 
i=1,2,...,223 
AY, Y) este covarianta scorurilor observate la partea 
a i-a şi la partea a j-a a testului, ij=1,2,...,n 
şi iz]. 


e coeficienţii py şi p ai lui Kuder şi Richardson, utilizabili atunci 
când cele n componente ale testului sunt itemi binari, adică Y; 
i=1,2,...,”, sunt variabile aleatoare cu repartitii de forma: 


1 0 ‘ 
Ie: > p,+q,= 
I P, d, Li q; 


(Richardson, Kuder, 1939): 


„141 


POE. Si) 


Pa = < [ is i 1, (8.3.4) 


Observație. Gas Riu Pr Lee coeficientului a: în cazul 
itemilor binari formula 8.3.1 devine formula 8.3.3. 


În formula 8.3.4 s-au folosit notatiile 


(8235) 


(8.3.6) 


e dăefieieatk 4 al lui Horst, obţinut prin modificarea coeficientului 
P29 (Guilford, 1965);. 


2 
LF o 
[94 = il II a să 
H Pi Ps (8 RSS) 
On- >, pa, hae 


unde: 


(8.3.8) 
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R; | =rangul itemului i din test, itemii fiind ordonati după dificul- 
tate, cel mai uşor având rangul n. R, este număr natural. 
. My = media scorurilor observate la test. 


Să urmărim proprietățile acestor coeficienți. 

Vom nota în continuare cu 6 diferența dintre dispersia 
- scorurilor observate la test şi suma dispersiilor scorurilor observate ale 
componentelor: | 


6=0,- o (8.3.9) 
g 


şi cu 


Px” P (Xn Tn) 


coeficientul de fidelitate al testului. 


TEOREMA 8.3.1 (Albu, 1990). Dacă pentru orice persoană peP 
scorurile observate la oricare două părți ale testului, Yp $i. Y, sunt 
variabile aleatoare independente, atunci au loc inegalitatile: 

Pine Aaa (8.3.10) 
A; este egal cu a dacă şi numai dacă toate covariantele o(Y, »¥;) sunt 
egale între ele, i,j=1,2....,7 şi iz]. 


Deci A; şi a sunt valori în general mai mici decât coeficientul 
de fidelitate, dar A; este mai apropiat de 2yr decât a, 


TEOREMA 8.3.2 (Albu, 1990).Dacă testul este compus din n parti 
care constituie măsurători paralele, atunci au loc egalitatile: 


Pi =A3=a astă (83, Lay 


În plus, în acest caz coeficientul de fidelitate Peste calculat 
cu următoarea formulă, numită formula generală Spearman-Brown 
pentru fidelitatea unui test care are componente paralele: 

2 | 11910 479 49) 


= nd ; GSS 1923) 
KERETAS 
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Observatii. 


A. Componentele testului fiind paralele, au loc relatiile 

| OY) Pe Wo), fel. Doosh, IE) (8.3.13) 
şi deci fiecare componentă va avea acelaşi coeficient de fidelitate, 
egal cu O(Y),Y)). 


B. Se observa ca: 
Pxr= P(Y, Y) dacă AY),¥2)=0 sau Ana l 


Pr > YnY:) dacă p(Y),Y,)e(0,1) 
Adică fidelitatea unui test format din părți paralele este cel puțin egală 
„cu fidelitatea unei parti. 


C. Formula lui Spearman-Brown a fost generalizată pentru cazul când 
scorul observat al testului se calculează ca sumă ponderată a 
scorurilor observate ale părţilor COmPRRAY, astfel (Li, Rosenthal, 
Rubin, ee 


5 w(1-ro7(Y,) | 


RRT al 
pe hil En (8.3.14) 
ww 0(Y,,Y,) 
i=] j=l 
unde: | 
w; = ponderea atribuită părții a i-a a testului, i=1,2,...,7; 
r; = coeficientul de fidelitate al părții a i-a a testului, i=1,2,...„n 


Dacă toate ponderile w, =1,2,...,n, au valoarea 1 şi dacă cele 
n parti ale testului constituie măsurători paralele, atunci coeficienţii 
de fidelitate ai tuturor părţilor iau aceeaşi valoare şi formula (8.3.14) 
coincide cu formula lui Spearman-Brown. 


TEOREMA 8.3.3 AS 1990). În general, au loc inegalitatile: 
P’xr = Px = Pa (8.3.15) | 
Coeficientii px şi 4 coincid dacă şi numai dacă toate 

probabilitățile p, î=1,2,....n, sunt egale, adică toate variabilele 

aleatoare Y; au aceeaşi repartiție. 
Deci valoarea furnizată de Ø aproximează mai ora 
coeficientul de fidelitate decât p37. 
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TEOREMA 8.3.4 (Albu, 1990). Dacă cele n părţi ale testului reprezintă 
măsurători paralele, atunci are loc egalitatea: 
Par Gy (8.3.16) 


| Nici unul dintre coeficienţii prezentaţi mai sus (a, Ax Po 2, %) nu 
depăşeşte valoarea 1. i 

În ceea ce priveşte semnul acestor coeficienţi, ei pot lua atât valori 
pozitive, cât şi valori negative. 


TEOREMA 8.3.5 (Albu, 1990). Au loc următoarele egalitati: 

Sgn @= sgn Qy = Sgn py = sgn 6 (8.3.17) 
Atunci când 6 este nenegativ, şi coeficientul A, este nenegativ; în schimb, dacă 
ô este negativ, coeficientul A; poate fi pozitiv, negativ sau nul. 


Întrucât coeficientul de fidelitate al unui test este un număr nenegativ, 
valorile coeficienţilor folosiţi pentru estimarea sa sunt convenabile doar dacă 
sunt pozitive. 


Din cele arătate mai sus rezultă că cel mai util coeficient pentru 
estimarea fidelității unui test este Als pentru ca: 

a. poate fi calculat şi pentru teste ai căror itemi nu sunt binari; 

b. este mai apropiat de coeficientul de fidelitate decât a; 

c. are o comportare consecventă fata de coeficientul de fidelitate, fiind 
totdeauna cel mult egal cu acesta (4;</p*); | 

d. poate lua valori pozitive şi în unele cazuri când ceilalţi coeficienţi 

sunt negativi. 


Să analizăm în continuare cazul particular n=2. Deci testul este alcătuit 
din două parti. 

Dacă aceste componente sunt măsurători paralele, atunci AY nY) 
reprezintă coeficientul de fidelitate al fiecăreia dintre parti (Y, sau Y) şi 
coeficientul de fidelitate al intregului test poate fi calculat cu ajutorul formulei 
lui Spearman-Brown: 


2 _ 2p(¥;,,¥5) 


yr = ETAS (8.3.18) | 


„ Spearman şi Brown au dedus această formulă impunând părţilor testului 
condiţii mai slabe decât cele cerute de paralelism. Astfel, s-a presupus că se 
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"poate construi un test alcătuit din două părţi, cu variabilele aleatoare asociate 
scorurilor observate Y; şi Y,, care să verifice egalititile: 


AY) = AY) = oF) = ary) (8.3.19) 
ŞI 
PY Y)) = constant, i=l, 2,3,4, iz) i (8.3.20) 
În aceste condiții are loc relația : 
2p(Y,.¥,) 
pF +¥,,¥,+¥,) > 8.3.21 
1443414 TPY) ( ) 


unde A(Y;+Y,, Y Sr) este tocmai coeficientul ge fidelitate al testului. 


Se constată că pentru a putea aplica formula lui Spearman- Brown 
trebuie să se verifice doar egalitatea o( Y,)=o(Y. 2) şi să se presupună că se poate 
construi un test ale cărui părţi Y; şi % să satisfacă cerinţele formulate prin 
egalitatile 8.3.19 şi 8.3.20. Practic este, însă, foarte greu de realizat un asemenea 
„test. 

“Flanagan (1955) a definit echivalenta ; a două teste, X şi Z, fiecare 
alcătuit din două parti, unul având scorurile observate X=Y r+Y, iar celălalt cu 
scorurile observate Z=Y. 3+Y, prin condiţiile: 


KYY) = KYY) | A (8.3.22) 
(scorurile observate la cele două teste au aceeaşi dispersie) şi ; 
O(Y;,¥;) = constant, pentru ij=1,2,3,4, ij 7 (8.3.23) 


| (covarianta oricărei perechi de parti de test este aceeaşi) 

Dacă sunt îndeplinite relaţiile 8.3.21 şi 8.3.22, atunci coeficientul de 
fidelitate al oricăruia dintre testele X şi Z ză fi calculat cu formula 
coeficientului g al lui Cronbach: 


(8.3.24) 


p(X,Z) = fi _ oo, eee 


oY, +) 


Se constată că în această focal nu intervin valori statistice ale 
variabilelor aleatoare Y. 3 şi Y,. Deci nici nu trebuie să existe testul cu scorurile 
observate Z=Y;+Y,. Dar, este deosebit de dificil ca, având un test alcătuit din 
două părţi, să se poată şti dacă se poate construi un test echivalent cu acesta în 
sensul lui Flanagan. 
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De remarcat că, dacă două teste îndeplinesc condiţiile impuse de 
Spearman şi Brown, atunci ele sunt echivalente în sensul lui Flanagan, iar 
formula 8.3.24 se reduce la formula lui Spearman-Brown. 

| In cazul n=2 coeficientul A; devine: 


02(Y,)+02(Y. | 
2 £ OOTO , daca P(Y | 
Ae oz o’(Y +Y») . i (8.3.25) 
Udi l ; daca p(¥ Y. 


Deci, dacă o(¥Y,,Y,) 2 0, atunci A; se calculează prin formula 8.3.24. 


8.4. METODE PENTRU EVALUAREA F IDELITATII 
TESTELOR 


Din cele arătate până acum se constată că în general nu se poate 
cunoaşte valoarea exactă a unui coeficient de fidelitate. Fiecare din formulele 
de calcul prezentate furnizează câte o valoare care coincide cu coeficientul de 
fidelitate numai în anumite condiţii particulare, greu de realizat. 

Cu toate acestea, pentru un test, în funcţie de ceea ce măsoară şi de 
condiţiile în care a fost administrat, se calculează unul sau mai mulţi dintre 
următorii coeficienţi, prin care se aproximează valoarea coeficientului de 
fidelitate: 


A. coeficienţii de stabilitate - se calculează prin metoda test- retest, corelând 
scorurile obţinute la test sila retest (acelaşi test aplicat după un interval de 
timp). Arată cât de stabile sunt scorurile în timp. 


B. coeficienţii de echivalență - rezultă din metoda formelor paralele, prin 
corelarea scorurilor obţinute la două teste paralele, administrate aproape în 
acelaşi timp. Arată cât de asemănătoare sunt cele două instrumente de măsură. 


C. coeficienţii consistenjei interne - se calculează în cadrul analizei consistentei 
interne, pe baza scorurilor obţinute la un test administrat o singură dată. Din 
această categorie fac parte coeficientul al lui Cronbach, coeficientul A, al lui 
Guttman şi coeficienţii Kuder- Richardson. Ei arată concordanța diferitelor parti 
ale testului. 
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D. coeficienţii de fidelitate interevaluatori - se calculează pentru teste al căror 
scor este rezultatul aprecierii subiective făcute de evaluator. Ei arată în ce 
măsură părerile mai multor evaluatori concordă între ele. 


Prezentăm în continuare aceste tipuri de coeficienţi, metodele prin care 
se obţin şi condiţiile în care pot fi utilizaţi. 


8.4.1. Metoda test-retest 


Metoda test-retest evaluează gradul în care scorurile obţinute la un test 
de acelaşi subiect sunt constante de la o administrare la alta. 

Se procedează astfel: 

(1) Se administrează testul unui grup de persoane. | 

(2) După un interval de timp se administrează testul, aceloraşi indivizi, 
în aceleaşi condiţii ca şi prima dată. _ 

(3) Se calculează coeficientul de oi afle liniară între scorurile 
observate în cele două situaţii. 

Valoarea obţinută se foloseşte pentru estimarea Aaditi testului, 
considerându-se că testul este paralel cu el însuşi, ceea ce înseamnă că între cele 
două administrări ale sale, scorurile reale ale persoanelor nu s-au schimbat. 

Coeficientul de corelaţie calculat prin această metodă se numeşte 
„coeficient de stabilitate. 

Metoda test-retest este utilă atunci când scorurile reale ale testului 
măsoară caracteristici durabile, generale şi specifice, ale persoanelor. 


__Temporar Durabil - ` 


hic: Specific 


XXXXXXXX 


Factorii temporari (starea de oboseală sau boală a celui examinat, 
emoțiile, temperatura si lumina din sala de testare etc.) pot ajuta unei persoane 
într-o ocazie şi îi pot scădea scorul observat la un alt experiment. Ei nu modifica 
scorul real al persoanei, ci influențează erorile de măsură. 

Aplicarea metodei test-retest impune să se asigure asemenea condiții- 
încât pentru fiecare persoană erorile de măsură la cele două testări să fie 
variabile aleatoare independente. Aceasta înseamnă, de exemplu, că intervalul 
de timp dintre test şi retest trebuie stabilit astfel încât subiecții să nu îşi poată 
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aminti cum au răspuns la test, întrucât multe persoane sunt tentate să repete, la 
întrebările la care nu sunt sigure de răspunsul corect sau potrivit, răspunsurile 
pe care le-au dat, la întâmplare, cu ocazia primei testări. Se recomandă ca 
lungimea acestui interval să nu fie mai scurtă de trei luni (Kline, 1993). 

Adesea, mai ales în cazul testelor de aptitudini şi de cunoştinţe, în 
intervalul de timp dintre test şi retest subiecţii îşi modifică scorul real, datorită 
maturizării, a experienţei sau a cunoştinţelor dobândite. 

Să analizăm, de exeniplu, ceea ce se poate întâmpla după prima 
administrare a unui test de cunoştinţe. Pe de o parte, intervine uitarea, care 
determină o scădere a scorurilor reale. Pe de altă parte, subiecţii pot dobândi 
„cunoştinţe noi, ceea ce face să crească scorurile reale. Unele persoane pot căuta 
în cărţi răspunsurile corecte la itemi, mai ales acolo unde nu au ştiut sau nu au 
fost sigure de răspuns. Şi astfel, nivelul lor de cunoştinţe, deci scorul real, 
creşte. 

În asemenea situaţii, coeficientul de corelaţie liniară între scorurile 
observate la test şi la retest nu măsoară fidelitatea testului de cunoştinţe. El arată 
cum se schimbă nivelul cunoştinţelor verificate la persoanele examinate. Pentru 
o mai bună interpretare a modificărilor intervenite în persoane, între test şi 
retest, este util să se calculeze media diferenţelor de scor dintre cele două 
administrări ale testului şi să se verifice dacă aceasta diferă semnificativ de zero. 

Valoarea coeficientului de corelaţie liniară test-retest poate fi apropiată 
de 1 şi atunci când testul nu este potrivit lotului de subiecţi, fiind foarte dificil 
sau, din contră, foarte uşor. În asemenea situaţii, majoritatea persoanelor vor 
obţine, la ambele administrări ale testului, scoruri foarte mici, respectiv foarte 
mari. Prin urmare, interpretarea valorii coeficientului de stabilitate al unui test 
trebuie însoţită de analiza formei histogramelor scorurilor observate la test şi la 
retest. 

Totdeauna, împreună cu valoarea unui coeficient de stabilitate se vor 
comunica: 

e lungimea intervalului de timp dintre test şi retest; 

e condiţiile în care s-au efectuat testările, pentru a putea identifica 
eventualele surse de eroare de măsură; 

e vârsta subiecţilor testaţi, întrucât s-a constatat că şi aceasta are 
influenţă asupra mărimii coeficientului de stabilitate (Schuerger, Zarrella, Hotz, 
1989). i 
O altă formulă pentru calculul coeficientului de stabilitate se aplică 
atunci când testul este utilizat pentru a se lua decizii, prin plasarea subiecților 
in una din categoriile "admis" (cei cu scor mai mare decât un prag fixat) sau 
"respins" (cei cu scor mai mic decât acest prag). Testul este stabil dacă de la o 
administrare la alta nu se produc modificări ale clasificării subiecților. 
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Rezultatele clasificărilor realizate pe baza testului şi a retestului pot fi 
reprezentate sub forma următorului tabel de frecvenţe: 


a ore: yt oma a 
| Pe eile Ciel ERIE SA 


Notând cu N numărul total al trilon care au participat la ambele 
administrări ale testului (N=atb+c+d), coeficientul de stabilitate se calculează _ 
cu următoarea formulă (Aiken, 1994); 


7 ad-be | 
ad-be+N*mintb,c} 


(8.4.1.1) 


Trebuie remarcat că acest coeficient ia valoarea maximă, egală cu 1, nu 
- numai atunci când clasificarea realizată pe baza testului coincide cu cea rezultată 
„în urma retestării (când b=c=0), ci şi dacă una singură dintre frecvențele bşic 
este nulă, frecvențele a si d fiind, ambele, nenule. 

Dezavantajul metodei test-retest constă în faptul că pretinde două 
administrări ale testului, ceea ce necesită timp si cheltuieli materiale. 


8.4.2 Metoda analizei consistentei interne 


Această metodă utilizează pentru estimarea fidelității unui test 
dispersiile si covarianţele scorurilor observate ale itemilor. Este avantajoasă, 
„necesitând o singură administrare a testului. Pe baza scorurilor observate ale 

itemilor se calculează de obicei unul dintre următorii coeficienţi: 
_ © coeficientul q al lui Cronbach; 
_ © coeficientul A; al lui Guttman; 

e coeficientul p» sau pz al lui Kuder-Richardson (dacă itemii carul 

sunt binari). 

Aceşti coeficienţi sunt denumiți coeficienți de consistență internă. Ei 
indică măsura in care itemii testului se referă la acelaşi lucru. 

Faptul că, în general, coeficienții de consistență internă coincid cu 
coeficientul de fidelitate al testului atunci când itemii componenți sunt paraleli, 
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adică măsoară acelaşi lucru si îl măsoară la fel de bine, conduce la concluzia că 
aceşti coeficienţi sunt utili pentru calculul fidelității testelor care măsoară o 
caracteristică unidimensională. 

Analizând formulele lor de calcul, se constată că valorile coeficienţilor 
de consistenţă internă cresc atunci când intercorelatiile itemilor, PIX) 
iJ>1,2..h, ij, sunt mari. In schimb, dacă toate intercorelatiile AY, Y; „iz sunt 

"egale cu zero, adică itemii testului nu sunt corelaţi liniar între ei, atunci 
coeficienţii œ, A; şi p» sunt egali cu zero, iar coeficientul Pa este negativ. 

Se impune o observaţie: dacă testul este administrat cu limită de timp, 
atunci ultimii itemi nu vor fi rezolvati de mai multe persoane, deci în lotul de 
subiecţi ei vor apărea de mai multe ori cu scorul zero. Intercorelatiile lor vor 
avea, din această cauză, valori mari, crescând astfel consistenţa. internă a 
testului. În concluzie, pentru a putea calcula coeficienţii de consistenţă internă 
ai unui test, acesta trebuie administrat fără limită de timp. 

În cazul testelor compuse din itemi binari, consistenţa internă este mare 
atunci când itemii au aproximativ aceeaşi dificultate şi majoritatea persoanelor 
care rezolvă corect un item îl rezolvă corect şi pe celălalt, 

O altă legătură între caracteristicile itemilor şi fidelitatea testului se 
obţine rescriind formula coeficientului a al lui Cronbach, cu ajutorul 
transformării: | 


n 
God 0,p(¥,,X) | (8.4.2.1) 
A 


unde, pentru fiecare item i, i=1,2,...,n: 
0; reprezinta abaterea standard a scorurilor observate la itemul i; 
P(Y, X) este coeficientul de corelaţie liniară între scorurile itemului i şi scorurile 
observate la întregul test. | 
Termenul 
Rel(Y)=o,(¥;,X) (8.4.2.2) , 
se numeşte indice de fidelitate al itemului i. Valoarea sa este cu atât mai mare, 
cu cât este mai mare coeficientul de corelaţie liniară dintre item şi test. 
Scriind formula de calcul a coeficientului @ al lui Cronbach astfel: 


Er |) APO . (8.4.2.3) 
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se deduce ca pentru a obtine un test cu o consistenţă internă bună trebuie aleşi 
itemi care au dispersii mici ale scorurilor şi corelaţii mari cu scorul total al 
testului. 

Dacă un test este compus din n itemi paraleli, atunci coeficientul său de 
fidelitate poate fi calculat cu formula lui Spearman-Brown, 8.3.12: 


2m np(Y Y>) 
Pats hoa Se 
1+(n-1)p(Y,,¥,) 


din care se deduce că fidelitatea testului depinde crescător de numărul itemilor 
componenți. Adăugarea de itemi paraleli va avea drept consecință o mărire a 
consistentei interne a testului. 

Din formula lui Spearman-Brown se poate afla de câte ori trebuie Bick 
(sau scurtat), prin itemi paraleli, un test dat, astfel încât fidelitatea testului 
obţinut să fie egală cu o valoare fixată. Raportul dintre lungimea noului test şi 
lungimea testului opus se calculează cu formula: 


_ PAL-P) 


TEN (8.4.2.4) 


unde: plin 4 | 

p = fidelitatea testului existent; _ 

= fidelitatea dorită, egală cu fidelitatea testului a cărui lungime este egală cu 
de k ori lungimea edita existent. 


Practic este însă dificil să se construiască itemi de test buni, care să fie 
paraleli cu itemii existenți în test. Pe de altă parte, testele lungi consumă mult 
timp şi sunt mai scumpe decât cele scurte. Deci, nu întotdeauna este posibilă şi 
rentabilă creşterea fidelității prin adăugarea de itemi paraleli. 


8.4.3. Metoda formelor paralele 


Metoda formelor paralele constă în administrarea a două teste, care 
reprezintă instrumente de măsură paralele, la momente foarte apropiate unul de 
altul şi determinarea coeficientului de corelaţie liniară între scorurile observate 
ale celor două forme. Valoarea calculată se numeşte coeficient de echivalență. 
Dacă cele două teste sunt paralele şi dacă pentru fiecare persoană erorile de 
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măsură la cele două administrari sunt variabile aleatoare independente, atunci 
coeficientul de echivalență coincide cu coeficientul de fidelitate al fiecărui test. 

Metoda formelor paralele este potrivită în cazul când se urmăreşte 
măsurarea unor caracteristici generale ale persoanelor. Asemenea caracteristici 
vor influenţa în acelaşi mod scorurile ambelor teste. 


Temporar Durabil 


XXXXXXXX XXXXXXXX General 


Specific 


Metoda formelor paralele prezintă unele avantaje faţă de metoda test- 
retest. Astfel, cele două forme fiind diferite, rezultatele la cel de-al doilea test 
nu mai sunt influențate nici de memorarea răspunsurilor date la primul test şi 
nici de aflarea răspunsurilor la întrebările la care nu s-a ştiut răspunde (în cazul 
testelor de aptitudini sau de cunoştinţe). 

Dar, metoda formelor paralele are şi inconveniente. Dintre acestea 
amintim următoarele: | 

e sunt necesare două administrări separate, ceea ce consumă timp; 

e intervine oboseala sau plictiseala persoanelor examinate, ceea ce 
influenţează scorurile la cel de-al doilea test; 

e elaborarea mai multor forme paralele de test poate fi dificilă şi 
costisitoare. 

Un procedeu de testare asemănător cu cel descris mai sus, dar mai puţin 
utilizat, îl constituie administrarea celor două forme ale testului, aceluiaşi grup 
de persoane, la momente mai puţin apropiate. O asemenea metodă este utilă 
atunci când se măsoară caracteristici generale si durabile ale persoanelor. 


Temporar Durabil 


În acest caz, coeficientul de corelaţie liniară al scorurilor observate ale 
testelor se numeşte coeficient de echivalență şi stabilitate, întrucât el reflectă 
atât stabilitatea în timp a scorurilor reale ale persoanelor, cât şi echivalenta 
măsurătorilor. 

Scorurile obţinute la cel de-al doilea test pot să difere de cele realizate 
"la prima testare şi datorită schimbării condiţiilor de administrare a testelor. 
Pentru a micşora efectele pe care această modificare le poate avea asupra 


General 


Specific 
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mărimii coeficientului de corelaţie dintre scorurile testelor, se obişnuieşte să se 
procedeze astfel (Aiken, 1994): 

e Se împarte lotul de-subiecti, aleator, în două părți egale. 

e La prima testare, fiecare jumătate a lotului de subiecți primeste un alt 
„test. 

e Laa SR testare, se inversează testele administrate, astfel încât 
fiecare subiect să răspundă la ambele teste. 

e Se calculează coeficientul de corelaţie liniară între scorurile celor 
două teste, fără a se lua în considerare momentul când au a, administrate 
„testele. 

Metoda formelor paralele se Ls An şi atunci când'se doreşte obţinerea 
unei colecţii de teste paralele, de bună calitate. Este, de exemplu, situaţia 
întâlnită în psihoterapie, când este necesară administrarea periodică, la intervale 
de timp relativ scurte, a unor teste de anxietate sau de depresie. Pentru ca 
„ subiecții să nu fie tentaţi să repete răspunsurile date la administrările anterioare 
ale testului se preferă utilizarea alternativă a unor forme de test paralele. 

- Un caz particular al metodei formelor paralele îl constituie metoda 
înjumătățirii (split-half). În literatura de specialitate, aceasta este inclusă uneori 
în cadrul analizei consistentei interne. 

Metoda injumatatirii constă în următoarele: 

e Se administrează testul unui lot de persoane. | 

e Se împarte testul în două părţi cât mai asemănătoare între ele. 

e Se calculează coeficientul de corelaţie între scorurile observate la cele 

două jumătăţi. 

„Dacă jumătăţile testului sunt instrumente de măsură paralele, atunci 
valoarea calculată reprezintă coeficientul de fidelitate al fiecăreia dintre părţi. 
Cu ajutorul lui, aplicând formula lui Spearman-Brown, se poate determina 
coeficientul de fidelitate al întregului test. 

Metoda înjumătăţirii rezolvă multe din problemele teoretice şi practice 
inerente metodei test-retest şi metodei formelor. paralele. Mai întâi, nu este 
necesar să se administreze două teste diferite şi nici să se administreze de două 
ori acelaşi test. În felul acesta nu există pericolul modificării scorurilor reale 
între administrări şi nici cel al memorării şi repetării răspunsurilor date la primul — 
test. 

Dar, dificultatea constă în construirea jumătăţilor care si fie măsurători 
paralele. Se recomandă (Cronbach, 1943; Pitariu, 1978; Traub, 1994) să se 
„elaboreze perechi de itemi care să fie similari ca: 

e forma (mod de prezentare a textului, a ilustraţiilor); 
e conţinut; 
© tip de întrebare (cu răspuns liber, cu răspuns la alegere etc.); 
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e medie şi abatere standard a scorurilor. 
Dar, itemii trebuie să fie independenţi, adică unul să nu sugereze 
răspunsul la celălalt. 

Din fiecare pereche, un item va intra într-o jumătate de test, iar al 
doilea, în cealaltă jumătate. 
recomandă plasarea celor două părţi una după cealaltă, întrucât intervine 
oboseala persoanelor examinate, care va influenţa scorurile la cea de-a doua 
jumătate, iar dacă testul este administrat cu limită de timp, este foarte probabil 
ca mulţi itemi din cea de-a doua parte să nu fie rezolvati datorită timpului de 
lucru insuficient şi nu din cauza necunoaşterii răspunsului corect. Pentru a evita 
asemenea situaţii, se poate adopta metoda par-impar: itemii unei jumătăţi vor 
ocupa locurile cu număr de ordine par, iar ceilalţi, locurile cu număr de ordine 
impar. Se obişnuieşte să se plaseze itemii în ordinea crescătoare a dificultății lor 
(Lord, Novick, 1968). | 

Apare, însă, o problemă în cazul când testul se administrează cu limită - 
de timp. Fiecare persoană care nu reuşeşte să răspundă la ultimii 27 itemi va 
avea scorul zero la aceştia şi, deci, scorurile la itemii pari şi la cei impari vor 
apărea mai puternic corelate decât sunt în realitate. Din acest motiv, metoda 
înjumătăţirii nu se va aplica atunci când administrarea testului se face cu limită 
de timp. 


8.4.4. Coeficienti de fidelitate inter-evaluatori 


În cazul testelor care nu au o cotare obiectivă, cum sunt testele 
proiective sau cele de creativitate, scorurile subiecţilor sunt influențate şi de 
persoana care face evaluarea răspunsurilor. Chiar dacă evaluatorii îndeplinesc 
cerinţele formulate în manualul testului, referitoare la cunoştinţele şi experienţa 
necesare, este puţin probabil ca ei să atribuie scoruri identice fiecărui subiect, 

_ Pentru a verifica în ce măsură scorurile testului sunt dependente de cel 
care a făcut cotarea, se calculează coeficientul de corelaţie liniară între scorurile 
i atribuite acelorași subiecți de evaluatori diferiți. Un asemenea coeficient se 
numeşte coeficient de fidelitate inter-evaluatori. 

Unii autori (Hammond, 1995) recomandă utilizarea, pentru aprecierea 
acordului dintre evaluatori, a coeficientului K al lui Cohen. Acesta ia valori între 
-1 şi 1 şi indică în ce măsură concordanța evaluărilor este diferită de cea datorată 
întâmplării (A se vedea Anexa I). 
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8.5. OBSERVATII ASUPRA METODELOR FOLOSITE 
PENTRU ESTIMAREA FIDELITATII 


Alegerea metodei aplicate pentru estimarea fidelității trebuie să ţină 
seama de ceea ce măsoară testul, de scopul pentru care el va fi folosit şi de 
condiţiile concrete în care se poate face testarea (există sau nu posibilitatea 
administrării repetate a testului, există sau nu forme paralele ale testului etc.). 

“ Atunci când testul măsoară o caracteristică durabilă Şi, deci, trebuie să 
fie puţin sensibil la situaţia de testare, sau când, pe baza scorurilor testului 
urmează să se tragă anumite concluzii valabile pentru o perioadă de timp mai 
îndelungată, se va aplica metoda test-retest. 

Dacă nu se poate asigura retestarea persoanelor după un interval de timp 
suficient de lung pentru ca subiecţii să nu îşi mai poată aminti răspunsurile date 
la test, dar există o formă paralelă a testului, se va utiliza metoda formelor 
paralele. 

În cazul particular când forma paralelă a testului a fost administrată 
împreună cu testul se va putea aplica metoda injumatatirii. l 

Dacă se ştie că testul se compune din itemi care măsoară aceeasi 
caracteristică -mai mult sau mai puțin durabilă- pentru estimarea coeficientului 
de fidelitate se va folosi o formulă de calcul al unui coeficient de consistenţă . 
internă. 

"În cazul testelor pentru care cotarea nu este obiectivă, evaluatorul 
devine o componentă a procesului de măsurare realizat cu ajutorul testului. 
Alături de o altă meodă de estimare a fidelității se va calcula şi coeficientul de 
fidelitate inter-evaluatori. 


"În general valorile coeficienţilor de consistenţă internă sunt mai mari 
decât cele ale coeficienţilor de echivalență, care sunt, de obicei, mai mari decât 
coeficienţii de stabilitate (Murphy, Davidshofer, 1987). Acest lucru se explică 
prin faptul că numărul factorilor care influenţează erorile de măsură este mai 
mare în metoda test-retest şi în metoda formelor paralele, decât în metoda 
analizei consistentei interne. De exemplu, acumularea de informaţii între test şi 
retest va afecta numai valoarea coeficienţilor de stabilitate, nu şi pe aceea a 
coeficienţilor de echivalență sau a coeficienţilor consistentei interne. 

Dacă, însă, persoanele examinate tin minte răspunsurile date la test Şi 
le repetă la retest, se poate obţine un coeficient de stabilitate mare, chiar dacă 
testul are consistenţă internă scăzută. . j 
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8.6. FACTORI CARE INTERVIN IN ESTIMAREA 
COEFICIENTILOR DE FIDELITATE 


Trebuie observat că experimentele efectuate pentru determinarea valorii 
unui coeficient de fidelitate nu cuprind, în general, întreaga populaţie de 
persoane căreia îi este destinat testul, ci doar un eşantion din această populaţie. 
Prin urmare, valoarea calculată este doar o aproximare (o estimare) a 
coeficientului de fidelitate. Luând un alt eşantion, se va obţine o altă valoare. 

Pentru ca estimarea coeficientului de fidelitate să fie cât mai precisă, 
este necesar să fie îndeplinite următoarele condiţii (Traub, 1994): 


A. Eşantionul să fie cât mai voluminos. Desi forma exactă a repartiţiei 
coeficienţilor de fidelitate calculati pentru diverse eşantione de acelaşi volum, 
extrase aleator din populaţie, nu este cunoscută, se obişnuieşte să se considere 
că abaterea standard a acestei repartitii (denumită eroare standard) este invers 
proporţională cu rădăcina pătrată din volumul eşantioanelor. Prin urmare, pentru 
a micşora de două ori eroarea standard este necesar să se mărească de patru ori 
volumul eşantionului. 


B. Eşantionul de subiecţi să fie reprezentativ pentru populaţia căreia îi este 
destinat testul. El trebuie să'fie la fel de eterogen ca şi această populaţie, întrucât 
gradul de omogenitate al eşantionului are influenţă asupra mărimii 
coeficientului de fidelitate. 


C. Măsurătorile efectuate cu ajutorul testului să fie independente între ele, adică 
măsurătoarea realizată asupra unui subiect să nu fie influenţată şi nici să nu 
influenţeze măsurătorile efectuate asupra altor persoane. Dacă administrarea 
testului se face în grup, acest lucru înseamnă că persoanele examinate vor fi 
supravegheate astfel încât nici una să nu poată copia. 

Atunci când calculul coeficientului de fidelitate impune ca fiecare 
persoană să răspundă de două ori la acelaşi test sau să răspundă la două forme 
paralele ale testului foarte asemănătoare între ele, cerința de independenţă a 
măsurătorilor se extinde, în sensul că măsurătorile efectuate asupra aceleiaşi. 
persoane trebuie să fie independente între ele. Aceasta înseamnă că nu li se va 
oferi subiecţilor posibilitatea de a revedea sau de a-şi aminti răspunsurile date 
la prima administrare a testului. 

Dacă se calculează un coeficient de consistenţă internă, se va urmări ca 
itemii testului să fie independenţi între ei. Prin urmare, rezolvarea unuia nu va 
fi condiţionată de rezolvarea altuia şi nu vor exista itemi care să se refere la 
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acelasi aspect, astfel încât subiecţii să răspundă la ei în acelaşi mod (corect sau 
greşit). 


D. Procedura de administrare a testului şi a retestului sau a celor două forme 
paralele ale testului să fie identică şi să fie aceeaşi cu cea care se va utiliza în. 
practică. Astfel, de exemplu, dacă se prevede ca testul să fie administrat cu 
„limită de timp, în 40 de minute, atunci acest interval de timp va fi respectat şi 
la administrarea testului pentru estimarea fidelității. 


8.7. INTERPRETAREA COEF ICIENTILOR DE FIDELITATE 


Dintr-o mulţime de teste ati toate celelalte caracteristici egale, este 
de preferat testul care are cea mai mare fidelitate. Dar, pe de o parte, testul cel. 
mai fidel poate fi cel mai scump sau mai dificil de administrat. Pe de altă parte, 
caracteristicile testelor sunt rareori egale. 

Este imposibil să se specifice un nivel minim care să fie impus 
coeficienţilor de fidelitate ai tuturor testelor. Dar, în pr actica obişnuită sunt utile 


-* următoarele recomandări: 


A. Se vor cere niveluri înalte de fidelitate testelor folosite pentru a se lua decizii 
importante asupra persoanelor şi celor care împart indivizii în mai multe 
categorii pe baza unor diferente relativ mici între ei. În selecţia profesională, de 
pildă, se vor folosi teste care au coeficienţi de fidelitate mai mari decât 0.9 (J. 
C. Nunnally, după Hammond, 1995). | i 


B. Se vor accepta niveluri scăzute de fidelitate atunci când testele se utilizează 
pentru a lua decizii preliminare, nu finale, si în cazul testelor care împart 
persoanele într-un număr mic de categorii, pe baza unor diferenţe individuale 
mari. 


C. Dacă un test serveşte la compararea grupelor de persoane, coeficientul său: 
de fidelitate poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, însă testul se- 
foloseşte pentru compararea persoanelor, una cu alta, coeficientul său de 
fidelitate trebuie să fi ie mai mare decât 0.85 (Aiken, 1994). 


În general, pala chestionarelor de personalitate şi a celor de 


interese este mai mică decât: cea a testelor cognitive (de cunoştinţe, de 
inteligenţă, de aptitudini speciale) (Aiken, 1994). 
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In practică se întâlnesc de obicei coeficienţi de fidelitate cuprinşi între 
0.70 şi 0.98 (Guilford, 1965), Testele cotate obiectiv care măsoară aptitudini 
cognitive pot furniza, în loturi eterogene de persoane, coeficienţi de fidelitate 
mai mari decât 0.8. Testele cotate subiectiv care măsoară aptitudini, testele de 
cunoştinţe şi cele care evaluează performanţe tipice (de exemplu chestionare de 
personalitate) au, adesea, coeficienţi de fidelitate mai mici decât 0.80 (Traub, 
1994), | 
Testele standardizate de cunoştinţe au, în general, o fidelitate mare spre” 
moderată. În schimb, testele cu alegere multiplă utilizate la clasă pot avea o 
fidelitate mai scăzută. Coeficientul lor de fidelitate este apropiat de 0.75. 

Validitatea fiind mai importantă decât fidelitatea, în practică se folosesc 
adesea teste care sunt valide pentru populaţia şi Situaţia în care sunt 
administrate, dar care nu au coeficienţi de fidelitate foarte mari. 


8.8. FIDELITATEA DIFERENȚEI SCORURILOR ÎNTRE 
TEST ŞI RETEST 


De multe ori ne interesează modul în care variază scorurile observate — 
la un test meM, administrat de două ori unui lot de persoane P (de exemplu, 
înainte şi după un tratament). Procedeul de lucru obişnuit constă în calculul 
mediei diferenţelor individuale dintre scorul retestului şi cel al testului şi 
aplicarea unui test statistic pentru verificarea semnificației acestei medii. Se 
pune, însă, problema: cât de bine măsoară diferenţele de scor schimbările reale 
petrecute în indivizi? Altfel spus, cât de fidelă este măsurarea diferenţelor de 
scor? 

Pentru a studia fidelitatea diferenţelor de scor se defineşte, pentru 
fiecare persoană peP, variabila aleatoare Dap, ale cărei valori sunt toate 
diferenţele de scor care ar putea fi observate la acea persoană: 

Dre = Aa x Afp. (8.8. 1) 

X mp1 $i Xpp2 Sunt variabilele aleatoare corespunzătoare scorurilor observate la 
test, respectiv la retest. 

Făcând presupunerea obişnuită din teoria testelor, variabila DY, $6 
compune dintr-o "valoare reală a diferenţei scorurilor", Try Şi O "eroare de 
măsură a diferenţei scorurilor", £p: 


Be = Tip Ep (8.8.2) 
Variabila T, este definită ca şi medie a diferenţelor observate: 
Imp = M(Drp) (8.8.3) 


deci ea este egală cu diferenţa scorurilor reale ale persoanei p între test şi retest. 
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Se noteaza: 
Dm» = variabila aleatoare corespunzătoare diferenţei scorurilor observate .în 
. întreaga populaţie P; ! | 
Im = variabila aleatoare care ia ca valori diferenţele scorurilor reale între test şi 
retest în populaţia P; | l 
Em = variabila eroare de măsură pentru diferențele de scor în populaţia P. 
Conform teoremei 6.1.1.1 în populaţia P are loc relaţia 
sa sot pei n i | (8.8.4) 
şi se poate calcula fidelitatea diferenţelor de scor pe baza formulei de definiţie 
` a coeficientului de fidelitate: 


(8.8.5) 


Ţinând. seama de felul în care a fost definită variabila Dry, se poate 
rescrie formula (8.8.5) astfel încât fidelitatea diferenţelor de scor să fie 
exprimată cu ajutorul fidelității testului, pp, al fidelității retestului, A , al 
dispersiilor în populaţia P a scorurilor observate la test şi la retest, 07, şi C», 
precum şi a covariantei scorurilor observate la cele două administrări ale 
testului, o}, (Traub, 1994): 


moan? 3 
01P1 +0297 -2045 ; (8.8.6) 


2 = 
p Dal Fẹ 2 2 


Se constată de aici că fidelitatea diferențelor de scor depinde crescător 
de fidelitatea testului gi de cea a retestului, si depinde descrescător de mărimea 
covariantei scorurilor observate la test şi la retest. Cu cât fidelitatea testului ŞI 
cea a retestului sunt mai bune, cu atât fidelitatea diferenţelor de scor este mai 
bună. Când scorurile observate la test şi la retest sunt necorelate liniar (0p=0), 
fidelitatea diferenţelor de scor este maximă. i 
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CAPITOLUL 9 
VALIDITATEA TESTELOR PSIHOLOGICE 


„9.1. DEFINIŢIA VALIDITATII 


Validitatea este unul dintre conceptele cele mai importante în activitatea 
de cercetare ştiinţifică. Ori de câte ori un cercetător îşi pune o întrebare de forma 
"Acest studiu răspunde într-adevăr problemei formulate?" sau "Acest 
instrument măsoară cu adevărat ceea ce vrem să măsurăm ?" sau "Cercetările 
din acest laborator ne arată într-adevăr lumea reală?", el se interesează de fapt 
de validitatea studiului ori a instrumentului. 

În esenţă, validitatea se referă la cât de bine realizează un studiu, o 
procedură sau un instrument de măsură ceea ce se presupune că face (Graziano, 
Raulin, 1993). În acest sens a fost înţeleasă validitatea, multă vreme, şi în teoria 
testelor. Iniţial, ea a fost definită şi cercetată în legătură cu funcţia îndeplinită 
de test. Astfel, de exemplu, Lafon (1973) definea validitatea unui test ca fiind 
calitatea acestuia "de a măsura exact ceea ce trebuie să măsoare", iar Lindeman 
(1978) scria că "validitatea unui test este dată de măsura în care acesta îşi 
„îndeplineşte funcţia”. | 

Observatia că psihologii care utilizează un test nu sunt interesaţi, de 
fapt, de proprietăţile acestuia, ci de atributele persoanelor testate, a condus spre 
o nouă acceptiune a termenului "validitate". Acum accentul nu mai cade pe 
integritatea testului, ci pe încrederea pe care o putem avea în deductiile făcute 
pornind de la scoruri, luând în considerare întregul proces prin care s-au obţinut 
aceste scoruri (Guion, 1986). Prin urmare, validitatea nu mai este privită ca o 
calitate a testului, ci ca o calitate a utilizării date rezultatelor testului. Sunt 
relevante, în acest sens, următoarele definiţii: 

e Validitatea este gradul în care o anumită inferenta făcută plecând de 
la test are înţeles, este potrivită şi utilă (Standards for Educational and 
Psychological Tests, 1985). 

e Validitatea este o judecată evaluativă globală asupra gradului în care 
dovezi empirice şi raționamente teoretice oferă sprijin ca, pe baza scorurilor 

testului, să se realizeze interpretări sau acţiuni potrivite (Messick, 1995). 
e Validitatea unui test se referă la cât de potrivite sunt interpretările 
descriptive, explicative sau predictive care se dau scorurilor sale (Silva, 1993). 
"În această nouă acceptiune, validitatea unui test trebuie legată atât de 
test, de ceea ce măsoară itemii săi, cât şi de contextul în care este utilizat testul 
şi de persoanele care răspund la test. Este absolut necesar ca atunci când se 
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vorbeste despre validitatea unui test să se precizeze funcţia la care se referă şi 
atributul măsurat sau variabila criteriu utilizată la compararea scorurilor. Nu este 

corect să se folosească expresia "validitatea testului", fără alte specificaţii. Nici 

un test nu este valid pentru toate scopurile sau în toate situaţiile sau pentru toate 

eşantioanele de indivizi (Standards for Educational and Psychological Tests, 

1974). 


Exemplu. 

Să considerăm un test at Nita de matematică, ai cărui itemi conţin 
exerciţii cu integrale. 

Pentru a putea aprecia validitatea acestuia este necesar, în primul rând, 
să se analizeze testul, urmărind dacă măsurarea se face corect, adică dacă 
răspunsurile notate în grila testului sunt corecte şi dacă itemii măsoară ceea ce 
se doreşte. De exemplu, dacă se intenţionează verificarea cunoaşterii formulelor 
de calcul, itemii trebuie să conţină exerciţii care se rezolvă prin simpla aplicare 
a acestor formule. În schimb, dacă se urmăreşte testarea deprinderii de a opera 
cu integrale, itemii vor conţine exerciţii care necesită efectuarea unor 
transformări pentru a se ajunge la formulele de calcul învăţate. 

- În continuare se ia în considerare contextul în care se va aplica testul. 
El poate servi, de pildă, la evaluarea cunoştinţelor de matematică ale absolvenți- 
lor de liceu, la examenul de bacalaureat. Dar dacă se doreşte să fie administrat 
la concursul de admitere la facultatea de psihologie, pentru a selecta persoanele 
care vor putea utiliza corect procedee statistice în prelucrarea datelor provenite 
din experimentele psihologice, este posibil ca predicțiile făcute pe baza 
scorurilor sale să nu fie corecte. Ar fi mai indicat să se folosească, în acest scop, 
un test de cunoştinţe care să conţină exerciţii cu probabilitati. 

Pe de altă parte, un test care conţine exerciţii cu integrale poate fi util 
pentru verificarea cunoştinţelor de matematică ale candidaţilor la Universitatea 
Tehnică. Dar, dacă exerciţiile sunt de dificultate medie, atunci la facultăţile cu 
concurenţă foarte mare, unde se înscriu absolvenţi de liceu foarte bine pregătiţi, 
şi la cele cu concurenţă foarte mică, unde se înscriu candidaţi cu o pregătire 
slabă, scorurile obţinute de subiecţi vor fi bi i ca valoare şi nu vor permite 
o diferenţiere între persoane. 

_ Daca testul este administrat cu ajutorul taleutatoiti ui atunci rezultatele 
sale pot fi influențate şi de factori care nu au legătură cu cunoştinţele de 
matematică (de pildă, de anxietatea faţă de calculator, care este legată de nivelul 
cunoştinţelor de informatică, sau de deprinderea subiecţilor de a folosi tasta- 
tura). Prin urmare, este greşit să se aprecieze nivelul cunoştinţelor de matema- 
tică pe baza scorurilor testului, dacă subiecţii diferă între ei în privinţa experien- 
tei în lucrul cu calculatorul. 


162 


Validarea unui test este procesul prin care se investighează gradul de 
validitate a interpretării propuse de test (Standards for Educational and 
Psychological Tests, 1985). Orice validare trebuie să înceapă prin a răspuunde 
la întrebările: i 
e Ce funcție îndeplineşte testul? 

e În ce scop se utilizează testul? 
e În ce condiţii se foloseşte testul? 
e Ce caracteristici au persoanele cărora li se administrează testul? 

Multă vreme, procedeele aplicate pentru validarea testelor au fost legate 
de răspunsul dat primei întrebări. Pentru fiecare dintre funcţiile testelor | 
psihologice - măsurare, decizie şi predictie - au fost formulate condiţiile pe care 
trebuie să le îndeplinească un test valid şi au fost propuse strategii de verificare 
a acestora. Fiecare set de condiţii, cu strategiile corespunzătoare, a fost etichetat 
şi a fost privit ca un "tip" de validitate sau ca o "fata" a validității. In Standards 
for Educational and Psychological Tests din anul 1974 sunt prezentate trei 
tipuri de validitate: , 

e validitatea conceptuală (construct validity); 
© validitatea de conţinut (content validity); 
e validitatea relativă la criteriu (criterion-oriented validity). 

„ Validitatea conceptuală şi validitatea de conţinut sunt legate de 
funcţia de măsurare a testelor. Un test este valid ca instrument de măsură dacă 
prin scorurile sale se realizează o măsurare corectă a atributului psihic pentru 
care a fost construit. Aprecierea corectitudinii măsurării impune identificarea 
tipului de scală pe care se face măsurarea şi verificarea condiţiilor din definiţia 
acestuia. pi tatal Ah: 
Validitatea relativă la criteriu este legată de funcţia de decizie şi de 
cea de predictie. Un test este valid relativ la criteriu dacă pe baza scorurilor sale 
se pot lua decizii corecte sau se pot face prognoze corecte asupra persoanelor 
examinate. Strategia utilizată pentru a aprecia dacă un test este valid relativ la 
criteriu constă în compararea scorurilor sale cu valorile unei variabile criteriu. 
Se apreciază că testul este valid dacă el poate înlocui variabila criteriu, adică 
dacă asemănarea dintre scorurile sale şi valorile variabilei criteriu este atât de 
mare încât, cunoscând scorul la test al unei persoane, se poate deduce valoarea 
variabilei criteriu pentru aceasta. d 

În practică nu este posibil totdeauna să se obțină valorile variabilei 
criteriu concomitent cu cele ale testului. Din acest motiv, strategiile folosite 
pentru aprecierea validității relative la criteriu au fost împărţite în două clase. Au 
apărut, astfel, două tipuri noi de validitate care, în unele lucrări de specialitate, 
înlocuiesc validitatea relativă la criteriu. Este vorba despre: 
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e validitatea concurentă, care necesită obţinerea scorurilor la criteriu 
aproximativ în acelaşi timp cu cele ale testului; 
| e validitatea predictivă, care permite ca administrarea testului să 
preceadă înregistrarea valorilor variabilei criteriu, între cele două acţiuni 
existând un interval de aon mai lung sau mai scurt, in functie de situatia 
concreta. i 


Standards for Educational and Psychological Tests din 1985 afirmă că 
nu se poate vorbi despre "tipuri" diferite de validitate: cele trei (sau patru) tipuri 
- descrise anterior sunt doar simple etichete atribuite unor categorii de strategii de 
„validare care se pot utiliza şi asociate. De pildă, pentru un test de atenție 

concentrată se pot cerceta atat validitatea conceptuală (constructul măsurat fiind 
atenţia concentrată), cât şi validitatea relativă la criteriu (drept criter iu poate 
servi testul de atenţie concentrată Toulouse-Pieron). 

Ideea asocierii fiecărei categorii de strategii de Hiid cu o anumită . 
funcţie a testelor a fost abandonată. Se acceptă acum că validarea relativă la 
criteriu poate fi efectuată atât în cazul testelor care măsoară un construct, cât şi 
pentru testele utilizate în predictie (Guion, 1986). În primul caz, criteriul este un 
construct ales datorită legăturilor pe care se presupune că le are (sau că nu le 

are) cu constructul măsurat de test. În cel de-al doilea caz, criteriul este o 
măsură a performanţei sau a comportamentului în muncă. Nu se poate afirma 
că o strategie de validare este mai potrivită decât alta pentru o anumită utilizare 
a testelor sau pentru o categorie specifica de inferente bazate pe scoruri, 

C. L. Lawshe se pronunţă pentru înlocuirea denumirii "tip de validitate" 
cu cea de "tip de analiză a validității“; prin "analiză a validității” el înţelege o 
procedură, un proces sau.o strategie prin care se colectează sau se generează 
date în vederea determinării extinderii ori a forţei inferentelor care pot fi făcute 
pe baza unei mulţimi de scoruri de test (Landy, 1986). Cu o singură modificare 
minoră, ce constă în înlocuirea expresiei "mulţime de scoruri de test" cu aceea 
de "mulţime de observaţii”, definiţia dată de Lawshe se transformă într-o 
definiţie a testării ipotezelor. Se constată, astfel, că validarea testelor este o 
operaţie similară verificării ipotezelor ştiinţifice. În cazul validării testelor, 
ipotezele pot fi formulate astfel: 

"Persoanele care au realizat un scor mare la testul X vor realiza o 

performanţă bună în activitatea Y." | 
sau . Pir 

"Persoanele care au obținut scoruri mari la testul X au un nivel înalt al 

constructului Y." | 
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În continuare vom prezenta categoriile de strategii de validare. În locul 
denumirilor "tipurilor" de validitate întâlnite în majoritatea lucrărilor de 
specialitate din limba română: wm i 

„e "validitate conceptuală" (concept validity) sau "validitate de 
construct" (construct validity) 
şi 
| e "validitate de conţinut" (content validity) 
vom utiliza denumirile | 

e "validitate relativă la construct" 
şi ta 

e "validitate relativă la conţinut”, i 
care, alături de denumirea consacrată "validitate relativă la criteriu", sugerează 
că validitatea testului este cercetată sub unul dintre aspectele posibile (construct, 
conținut sau criteriu). 


9.2. VALIDITATEA TESTULUI RELATIVĂ LA 
CONSTRUCTUL MĂSURAT DE ACESTA 


Validitatea relativă la construct se aplică în cazul testelor care măsoară 

constructe psihologice, cum sunt chestionarele de personalitate. Ea face apel la 
diverse teorii psihologice pentru a verifica, în primul rând, dacă testul se referă 
cu adevărat la constructul pe care trebuie să îl măsoare, şi apoi, dacă scorurile 
obţinute de subiecţi la test reflectă corect mărimea acestui construct la 
persoanele respective; altfel spus, dacă între scorurile testului şi valorile 
constructului există o relaţie funcțională monotonă (de obicei această relaţie este 
presupusă liniară): | 
scor la test = f(valoarea constructului) 
Validitatea relativă la construct impune analizarea testului din mai 
„multe puncte de vedere şi prin metode diferite. Un algoritm posibil al validării 
relative la construct, valabil pentru toate măsurătorile psihologice si 
educaţionale, inclusiv pentru evaluările performanței, constă din următoarii paşi 
(după Messick, 1995); 


A. Mai întâi se cercetează cât de relevant şi reprezentativ este conţinutul testului 
pentru constructul care trebuie măsurat. O asemenea analiză impune descrierea 
amănunţită a domeniului constructului respectiv, adică prezentarea deprinde- 
rilor, a cunoştinţelor, atitudinilor, motivelor, a altor atribute care au legătură cu 
constructul şi specificarea relaţiilor dintre ele. Un grup de experţi apreciază apoi 
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dacă cele mai importante porţiuni ale domeniului constructului sunt acoperite 
de conţinutul testului. 

Este foarte utilă şi cercetarea modului în care constructul este 
"reprezentat în test". Pentru aceasta se realizează un model al rezolvării testului, 
conţinând mecanismele teoretice (procese, strategii, cunoştinţe) despre care se 
presupune că ar avea influenţă asupra răspunsurilor date la test. Se analizează 
apoi dacă elementele modelului au legătură cu constructul pe care trebuie să îl 
măsoare testul şi cu răspunsurile care se pot obţine la test. De mare folos, în 

„această analiză, poate fi reţeaua nomologică întocmită cu ocazia explicării 
constructului. 

Dacă scorurile testului sunt dependente mai mult de alţi factori decât de 
componentele constructului care trebuie măsurat, se vorbeşte despre o 
"subreprezentare a constructului în test". Acest lucru se poate întâmpla dacă 
elemente care nu au legătură cu constructul determină ca rezolvarea testului să 
fie foarte dificilă sau, din contră, foarte uşoară. De exemplu, dacă itemii unui 
test de cunoştinţe de statistică pretind efectuarea unor calcule cu numere având 
multe zecimale, apare riscul de a obţine răspunsuri eronate din cauza greşelilor 
de calcul şi nu datorită absenței cunoştinţelor de statistică. 


B. O altă etapa a validării constă în analizarea consecventei răspunsurilor la 
itemii testului. În acest scop se identifică procesele implicate în obţinerea 
scorurilor la itemi şi se urmăreşte dacă acestea acţionează similar la toți itemii 
din întregul test sau dintr-o parte fixată a acestuia. 

Mijloacele de verificare a consecventei iilor sunt variate: se 
cercetează dacă timpii de răspuns la itemi sunt aproximativ constanti sau dacă 
scorurile itemilor corelează semnificativ între ele ori dacă mişcările ochilor 
subiecţilor în timpul conceperii răspunsurilor nu variază prea mult de la un item 
la altul. 


C. Pornind de la ideea că scorul obţinut la test este rezultatul acţiunii mai multor 
variabile, dintre care unele au legătură cu constructul măsurat, se urmăreşte dacă 
structura scorului la test reflectă structura domeniului constructului măsurat. 
Pentru aceasta, se descompune scorul total al testului în scoruri parţiale 
(scoruri ale unor grupe de itemi care corelează între ei sau scoruri factoriale) şi 
se presupune că fiecare asemenea scor reprezintă măsura unei variabile. 
Adesea, în scopul identificării unor asemenea variabile se utilizează 
analiza factorială. Ea permite să se determine una sau mai multe variabile 
(numite factori) ale căror valori (numite scoruri factoriale) se combină liniar 
pentru a forma scorul total al testului. Această metodă, numită validare 
factorială, se aplică mai ales în cazul testelor care măsoară constructe multidi- 
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ee cand se verifică şi dacă variabilele puse în evidenţă de analiza 
factorială corespund componentelor constructului. 

Se caută semnificaţia variabilelor măsurate prin scorurile parţiale ale 
testului, se rețin cele care au legătură cu constructul şi se verifică dacă 
importanţa acestora în domeniul constructului este reflectată corect prij 
ponderile pe care le au măsurile lor în scorul total al testului. 


D. Se estimează în ce măsură concluziile desprinse până la acest pas al 
algoritmului de validare pot fi generalizate, adică pot fi extinse asupra altor 
populații sau altor ocazii de examinare cu ajutorul testului. Se încearcă să se 
stabilească dacă interpretările propuse pentru scorurile testului se mențin atunci 
când se schimbă situația în care se face examinarea, momentul examinării ori 
evaluatorii. 


E. Se cercetează relațiile dintre scorurile testului si diverse alte măsurători 
psihologice sau observații non-evaluative asupra comportamentului. Această 
verificare este denumită uneori validare convergentă si discriminantă. 

Un test are validitate convergentă dacă măsoară ceea ce evaluează şi 
alte teste sau variabile care se referă la acelaşi construct, adică între scorurile 
sale şi rezultatele respectivelor măsurători există o relaţie funcţională monotonă 
(liniară sau nu). Un test are validitate discriminantă dacă evaluează altceva 
decât diverse teste. sau variabile despre care se ştie că se referă la constructe ce- 
nu au legătură cu constructul măsurat de test. Aceasta înseamnă că scorurile 
testului nu sunt în relaţie funcţională monotonă cu rezultatele acelor măsurători. 

Verificarea validității convergente şi discriminante se realizează 
conform următorului algoritm: 

(1) Se identifică acele comportamente care sunt legate de constructul măsurat 
de test. 

(2) Se determină constructele care au legături cu constructul măsurat de test şi 
se pun în evidenţă acele comportamente legate de ele care pot fi conectate cu 
constructul măsurat de test. | 

(3) Pentru toate comportamentele reţinute se apreciază ce fel de corelaţii ar 
putea exista între măsurile lor şi o măsură bună a constructului care ne 
interesează (corelaţii pozitive, negative, mari, mici sau nule). 

(4) Se determină coeficienţii de corelaţie între scorurile la testul studiat şi 
rezultatele unor măsurători (eventual scoruri de teste) efectuate asupra 
comportamentelor reţinute. 

(5) Se compară coeficienţii de corelaţie obţinuţi cu valorile aşteptate. 

O metodă utilizată pentru verificarea validității convergente şi 
discriminante a testelor este aceea propusă de D. T. Campbell şi D. W. Fiske 
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(Anastasi, 1976), bazată pe matricea "trăsături multiple - metode multiple" 
(multitrait-multimethod matrix). Aceasta contine valorile coeficientilor de 
corelaţie liniară între diverse măsurători ale aceloraşi constructe, obţinute prin 
intermediul a două sau trei tehnici ori instrumente diferite. i 

Exemplu | | 
În urma evaluării constructelor A, B şi C, despre care se face 
presupunerea că nu au legături între ele, prin trei metode diferite -"test I", "test 
II" şi "test III"- s-a obţinut următoarea matrice de coeficienţi de corelaţie liniară 
(pentru a se putea urmări mai uşor datele, ea a fost scrisă sub forma unui tabel): 


Test III 


A 4 
TestI B ăi 
G i 


A) pt | $ i 
Testi B | .12. 03 . | 
CAE, jan ca cea SPNG 
| Aa | „86 
RERE OTT e PSN) £58 35 41 .85 


Observaţie. Coeficientii cu valori mai mari decât .35 sunt semnificativi la pragul | 
p=0.05. 


Valorile notate pe diagonala principală sunt coeficienţii de fidelitate ai 
testelor, obţinuţi prin metoda formelor paralele. De exemplu, pentru testul II, 
coeficienţii de fidelitate sunt 0.76 (pentru constructul A), 0.77 (pentru 
constructul B) şi 0.83 (pentru constructul C). 

Valorile de pe diagonalele celorlalte căsuțe sunt coeficienţii de corelaţie 
între măsurătorile realizate de cele trei teste pentru aceleaşi constructe. Ei 
servesc la verificarea validității convergente. De exemplu, pentru constructul A, 
coeficienţii de corelaţie sunt: 

0.42 (testul I cu testul ID; 

0.50 (testul I cu testul III); 

0.54 (testul II cu testul III). 
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Toţi aceşti coeficienţi sunt semnificativi statistic la pragul p=0.05, ceea ce 
denotă o bună validitate convergentă a celor trei teste. | 
Celelalte valori din matrice reprezintă coeficienţii de corelaţie liniară 
între constructe diferite, măsurate prin acelaşi test sau prin teste diferite. Ei 
servesc la aprecierea validității discriminante a testelor. | 
Se observa că testele I şi II discriminează între constructele A, B şi C 
(coeficienţii de corelaţie aflaţi sub diagonala căsuţelor I-I, I-II şi H-H sunt 
nesemnificativi la pragul p=0.05), în timp ce testul III nu are validitate 
discriminantă: coeficienţii de corelaţie liniară între constructele AB site, 
măsurate prin testul III (in căsuţa II-III) sau prin testul III şi un alt test (în 
căsuţele I-III şi II-III) sunt, în general, semnificativi la pragul p=0.05. 


În exemplul prezentat, validitatea convergentă şi discriminantă a testelor 
I, II şi III a fost uşor de dedus. Dar, în practică, apar situaţii complexe, greu de 
interpretat. Uneori corelatiile dintre constructe diferite măsurate prin aceeaşi 
metodă sunt mai mari decât corelatiile dintre măsurile aceluiaşi construct 
obţinute prin metode diferite (chestionar creion-hârtie, tehnică proiectivă, scală 
de evaluare, interviu etc.). Aceasta înseamnă că metodele, mai precis unele 
elemente ale metodelor, au o importanţă mai mare în evaluare decât ceea ce se 
măsoară prin ele. ri i 

Mai trebuie reținut că pentru aprecierea validității discriminante a unui 
test este util să se calculeze, pe lângă coeficientul de corelație dintre test şi o altă ` 
măsurătoare, gi coeficientul de corelație dintre constructele măsurate. Se aplică 
formula 8.2.2. Întrucât coeficienții de fidelitate iau valori subunitare (valoarea 
1 este extrem de rară), corelatia constructelor este, în valoare absolută, mai mare 
decât valoarea absolută a coeficientului de corelație al scorurilor observate. 
Dacă se obține un coeficient de corelație mare între două constructe care, 
teoretic, nu au nimic în comun, validitatea discriminantă a testului este 
necorespunzătoare. 


Validarea convergentă a unui test este necesară, dar nu si suficientă 
pentru a dovedi că testul măsoară ceea ce sé doreşte. Aceasta, deoarece 
etichetele atribuite testelor reprezintă trăsăturile sau predispozitiile pe care 
testele ar trebui să le măsoare. Corelatia mare între două teste care poartă 
aceeaşi etichetă poate fi cauzată de existenţa, în cele două teste, a unor itemi 
asemănători, care nu totdeauna sunt reprezentativi pentru constructul pe care 
testele intenţionează să îl măsoare. Analiza factorială sau analiza de clusteri 
efectuată asupra itemilor din testele cu aceeaşi denumire poate ajuta la 
explicarea corelatiilor dintre scorurile testelor. 


169 


F. Se analizează interpretările propuse pentru scorurile testului şi sursele de 
invaliditate a testului, pentru a deduce posibilele consecinţe negative ale 
utilizării testului, atât pe termen scurt, cât şi pe perioade mai îndelungate. 


Din cele prezentate mai sus se constată că întregul proces de validare 
relativă la construct a testului constă în formularea de ipoteze ştiinţifice (asupra 
componentelor constructului, asupra relaţiilor dintre aceste componente etc.) şi 
în verificarea acestora. Metodele aplicate în validare sunt dependente de 
ipotezele formulate. Din acest motiv nu există metode valabile paniy validarea 
relativă la construct a oricărui test. 

Trebuie reținut că prin validarea testului relativă la constructul măsurat 
se validează atât testul cât şi ipotezele aflate la baza sa. Validitatea testului şi - 
validitatea constructului sunt inseparabile. Când un test nou este elaborat pentru 
măsurarea unui construct cunoscut, riscul ca validitatea să fie nesatisfăcătoare 
este mai mare pentru test decât pentru construct. Dar, poate să se constate şi 
necesitatea revizuirii constructului (L.J. Cronbach, după Silva, 1993). 


9.3. VALIDITATEA TESTULUI RELATIVĂ LA . 
CONŢINUTUL SAU 


Acest tip de validitate este analizat la testele care se utilizează pentru a 
estima "cum acţionează o persoană în universul de situaţii pe care testul 
intenţionează să îl reprezinte" (Standards for Educational and Ie doica! 
Tests, 1974). 

În literatura psihologică există păreri diferite ea d ceea ce se urmăreşe 
prin validarea testului relativă la conţinut. Anastasi (1976), de pildă, consideră 
că acest tip de validare implică "examinarea sistematică a conţinutului testului 
pentru a determina dacă el acoperă un eşantion reprezentativ din domeniul de 
comportamente pe care testul în cauză trebuie să îl măsoare”. În această 
acceptiune, itemii testului sunt priviţi ca reprezentând un eşantion extras dintr-o 
populaţie largă de itemi posibili care definesc ceea ce testul trebuie să măsoare. 
Dacă eşantionul este reprezentativ pentru populaţie, atunci se admite că testul 
are validitate relativă la conţinut (Gregory, 1992). 

Alţi autori înlocuiesc expresia "domeniu de comportamente" cu 

"mulţimea sarcinilor” sau "mulţimea performanţelor". 

R. T. Lennon consideră că validitatea relativă la conţinut se referă la 
răspunsurile subiectului şi nu la întrebările testului. Pentru analizarea acestui tip 
de validitate trebuie luat în considerare nu numai conţinutul itemilor testului ci 
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si procesul utilizat de subiect pentru a ajunge la formularea rapunsului (Silva, 
1993). De exemplu, un test avand drept domeniu de continut "cunostintele de 
ortografie", format din itemi cu alegere multiplă, poate verifica dacă un individ 
recunoaște cuvintele scrise corect din punct de vedere ortografic, dar nu şi dacă 
acesta ştie să scrie corect după dictare. Deci nu este suficient să se spună că 
testul evaluează cunoştinţele de ortografie. | 

Adoptând punctul de vedere formulat de Anastasi ( 1976), analiza 
validității relative la conţinut a unui test impune ca prim pas definirea şi 
descrierea domeniului de conţinut al testului. Este esenţial ca descrierea să fie 
cât mai detaliată şi să fie precizate clar limitele acestui domeniu. 

Pasul următor îl constituie analizarea itemilor testului. Sunt eliminaţi 
acei itemi care nu se referă la comportamente cuprinse în domeniul de conţinut. 
Pentru itemii rămaşi se identifică zonele domeniului de conţinut pe care le 
măsoară. La această operaţie este bine să participe cât mai mulţi experţi, care să 
aprecieze pentru fiecare item dacă se referă la domeniul de conţinut al testului 
- şi dacă este relevant. O analiză atentă o pretind itemii complecşi: aceştia pot să 
disperseze atenţia subiecţilor şi, prin urmare, scorul lor să fie contaminat de alte 
caracteristici decât aceea care ar trebui. să fie măsurată. 


Exemplu. 
Li se poate cere elevilor să efectueze aceleaşi operaţii aritmetice 
formulând două probleme diferite: i 

a. Care este cel mai mic număr întreg x pentru care are loc inegalitatea x-0.25(x- 
125,3 | | 

b. Un melc urcă pe un stâlp înalt de 5.5 m, pornind de la bază. În fiecare zi el 
înaintează cu 1 m, iar în timpul nopţii alunecă în jos cu 0.25 m. În a câta zi 
melcul atinge vârful stâlpului? 

Cea de a doua problemă le propune subiecţilor o sarcină mai complexă 
decât prima, întrucât le pretinde să citească un text mai lung şi să dea dovadă de 
atenţie, să observe că întrebarea se referă la ziua în care este "atins" vârful 
stâlpului. Răspunsul corect este "ziua a şaptea", chiar dacă după ce ajunge în 
vârful stâlpului, în ziua a şaptea, melcul coboară cu 0.25m în cursul nopţii. Dacă 
problema a doua este inclusă într-un test de raţionament aritmetic pentru elevi, 
este posibil ca scorul său să fie alterat de variabila irelevantă "deprinderea de a 
citi". i 

Din acest motiv este important să se verifice pentru fiecare item dacă 
nu cumva necesită un comportament care nu aparține domeniului de conținut 
al testului. | | 

Ultima etapă a validării constă în compararea structurii testului cu 
Structura domeniului de conţinut. Se verifică dacă sunt acoperite toate zonele 
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domeniului de conţinut şi dacă itemii sunt repartizaţi probebadaal cu măr imea 
şi importanţa zonelor. | 

Aprecierea generală privind validitatea testului relativă la conţinutul său 
este subiectivă. Ea nu apelează la metode statistice, ci se bazează doar pe 
raționamente. Din acest motiv, validarea relativă la conținut este denumită în 
literatură şi validare logică sau validare rațională (Thorndike, Hagen, 1961; 
Anastasi, 1976). 

Totuşi, în cazul testelor care verifică deprinderi sau cunoştinţe însuşite 
` în cadrul unui program de instruire există recomandarea de a lua în considerare, 
la aprecierea validității relative la conţinut a testului, şi rezultatul compararii 
statistice a scorurilor obţinute la test de aceleaşi persoane, înainte şi după acest 
program (Anastasi, 1954). Într-adevăr, dacă există o suprapunere între 
conţinutul itemilor testului şi conţinutul programului de instruire şi dacă itemii 
sunt bine construiți, atunci este de aşteptat ca scorurile finale să fie mult mai 
mari decât cele iniţiale, deci media diferenţelor de scor să fie pozitivă şi 'să 
difere semnificativ de zero. ; 

Validarea relativă la conținut se impune în cazul testelor utilizate la 
măsurarea unui atribut ce nu poate fi exprimat printr-un construct (Murphy, 
Davidshofer, 1991). De exemplu, putem descrie destul de detaliat domeniul de 
conţinut pentru "cunoştinţe de psihometrie", dar este foarte dificil să găsim. 
comportamentele prin care această caracteristică să poată fi observată. 

Validitatea relativă la conţinut se studiază mai ales în cazul testelor de 
cunoştinţe, atunci când nu există nici un criteriu extern potrivit pentru a analiza 
validitatea relativă la criteriu. 

Trebuie menţionat că validarea relativă la conţinut nu permite să se 
“tragă nici o concluzie despre calitatea măsurătorii realizate de test (Murphy, 

Davidshofer, 1991). De asemenea, ea nu furnizează suficiente informaţii pentru 
a putea interpreta corect scorurile testului. Nu se poate afirma că, dacă testul are 
validitate relativă la conţinutul său, atunci în privinţa atributului măsurat de test, 
un subiect care a realizat un scor mai mare îi este superior unuia care a obţinut 
un scor mai mic. 

Deci, i pia d cuprinse sub denumirea de "validarea testului relativă 
la conţinutul său" nu reprezintă o validare, în sensul definiţiei date de Standards 
for Educational and Psychological Tests din 1985. Ele realizează doar analiza 
testului în privinţa clarităţii, a reprezentativitatii şi a relevantei conţinutului său. 


9.4. VALIDITATEA TESTULUI RELATIVĂ LA UN 
CRITERIU 


9.4.1. Metode de cercetare a validității relative la criteriu 


Validarea relativă la criteriu se referă la gradul în care deducţiile făcute 
pornind de la scorurile testului-concordă cu cele bazate pe valorile unei alte 
măsurări, numită criteriu. Validarea relativă la criteriu conţine proceduri care. 
compară scorurile testului cu evaluări, clasificări sau | măsurători (mintale ori 
comportamentale) ale aceloraşi subiecți. 

Pentru fiecare dintre criteriile utilizate la valide, este necesar ca în 
manualul testului să se explice motivele alegerii sale şi să i se facă o descriere 
amănunţită (Standards for Educational and Psychological Tests, 1985). 

Aprecierea validitatii relative la criteriu se bazează, de obicei, pe 
valorile unui coeficient de validitate a testului, care exprimă numeric rezultatul 
compararii scorurilor testului cu valorile criteriului. 

Coeficientul de validitate al unui test, conform definiţiei din majoritatea 
lucrărilor de teoria testelor, este egal cu coeficientul de corelaţie liniară între 
scorurile testului şi rezultatele unei măsurători considerate drept variabilă 
criteriu. Unii autori (Lord, Novick, 1968) înţeleg prin coeficientul de validitate 
valoarea absolută a coeficientului de corelaţie liniară; alţi autori (Cureton, 1955) 
impun calculul coeficientului de corelaţie între scorurile observate la test şi 
scorurile reale ale variabilei criteriu. 

În literatura de specialitate există şi recomandarea de a calcula 
coeficientul de validitate folosind alţi indici în locul coeficientului de corelaţie 
liniară. De exemplu, Cronbach (1966) permite calcularea validității relative la 
criteriu cu ajutorul coeficientului de corelaţie a rangurilor. | 

De fapt, în majoritatea cazurilor, testele şi criteriile realizează doar 
măsurări pe scală ordinală, nu pe scală de interval. Din acest motiv, calculul 
coeficientului de corelaţie” liniară între scorurile testului şi valorile criteriului nu 
este corectă. Ţinând cont de faptul că prin compararea scorurilor testului cu 
valorile criteriului se realizează, de fapt, compararea ierarhiilor produse în 
rândul subiecţilor de test şi de criteriu, pentru studiul validității relative la 
criteriu se pot utiliza toţi coeficienţii care servesc la compararea a două 
clasamente prezentaţi în Anexa I. 

Se apreciază că un test are validitate bună atunci când coefi cientul de 
validitate este mare. i 

Uneori se poate îmbunătăți valoarea coeficientului de validitate prin 
gruparea scorurilor testului, urmată de transformarea valorilor acestora (Albu, 
Pitariu, 1994 si 1995a). 
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O altă posibilitate de cercetare a validității unui test relativă la criteriu 
„utilizează două giupe contrastante de subiecţi, formate pe baza valorilor 
criteriului: una este compusă din indivizi cu rezultate foarte bune, cealaltă din 
persoane cu rezultate foarte slabe. Se compară statistic mediile scorurilor 
obţinute la test de persoanele din cele două grupe şi se apreciază că testul este 
valid relativ la criteriu dacă mediile diferă semnificativ, la un prag de 
probabilitate fixat (Anastasi, 1976). Această metodă se aplică mai ales atunci 
când variabila criteriu este calitativă - deci nu se poate calcula coeficientul de 
- corelaţie liniară - şi atunci când criteriul este multidimensional, având mai multe 
componente cantitative şi/sau calitative. 

Unii autori (Hammond, 1995) recomandă ca validarea unui test relativă 
la criteriu să utilizeze mai multe variabile criteriu, dintre care unele nu au 
legătură cu ceea ce testul măsoară sau prezice. Acestea servesc la verificarea 
specificităţii testului. Este de dorit ca testul să nu coreleze cu ele. 

În cazul testelor utilizate pentru măsurare, validarea relativă la criteriu ` 
este o componentă a validării relative la constructul măsurat. Ea apreciază 
"gradul în care rezultatele furnizate de test corelează cu rezultatele altui 
instrument de evaluare despre care se presupune că măsoară acelaşi construct 
sau unul similar” (S. N. Haynes, citat după Silva, 1993). Evident, calculul 
coeficientului de corelaţie trebuie să fie precedat de analiza constructelor 
măsurate de test şi de criteriu. 

Chiar şi validarea factorială utilizată pentru cercetarea validității relative 
la construct a unui test este, de fapt, o validare relativă la criteriu (Anastasi, 
1954). Criteriul este reprezentat, în acest caz, de factorul care corespunde 
constructului măsurat de test. Una dintre condiţiile impuse pentru a putea 
aprecia că testul este valid este ca itemii săi să aibă saturatii mari în factorul 
respectiv. Or, saturatia unui item într-un factor este valoarea coeficientului de 
corelaţie liniară între scorurile itemului şi scorurile factorului. | 

În cazul testelor utilizate pentru a se lua decizii, validarea relativă la 
criteriu urmăreşte dacă deciziile luate folosind scorurile testului coincid cu cele 
care au la bază valorile unei variabile criteriu, despre care se presupune că 
permite să se ia decizii corecte. De exemplu, decizia poate consta în acceptarea 
sau respingerea candidaţilor care concurează pentru un post. Se dovedeşte că 
testul este valid relativ la acest criteriu dacă se constată că indivizii acceptaţi (pe 
baza unor considerente care nu includ rezultatele testului) sunt tocmai cei care 
au scoruri mari la test, iar cei respinşi sunt cei cu scoruri mici. 

Validarea testelor utilizate pentru predictie are în vedere gradul în care 
scorurile testului -numit în acest caz predictor- pot fi utilizate pentru a se deduce 
performanţa la o variabilă numită criteriu, independentă de test (Guion, 1974). 
Trebuie menţionat că o aceeaşi variabilă poate să joace rol de predictor într-un 
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caz (de exemplu, pot EE şcolară ca predictor pentru performanţa 
profesională) sau rol de criteriu în alt caz (de exemplu, aceeaşi performanţă 
şcolară ca şi criteriu pentru un test de inteligenţă). 

„Există două strategii utilizate în mod obişnuit pentru aprecierea 
validității relative la criteriu a testelor: 

e validarea concurentă; 

e validarea predictivă. 

Validarea concurentă se aplică îndeosebi pentru testele utilizate la 
obţinerea unor diplome sau licenţe, care măsoară cunoştinţele sau deprinderile 
persoanelor, şi pentru testele care servesc la stabilirea unui diagnostic clinic. Se 
cercetează validitatea concurentă atunci când se doreşte să se cunoască în ce 
măsură scorurile testului estimează poziţiile ocupate în prezent de subiecţi la un 
criteriu relevant. De exemplu, pentru un test de depresie, validitatea concurentă 
oferă informaţii despre gradul de coincidenţă dintre concluziile desprinse din 
interpretarea scorurilor testului şi părerile psihologilor clinicieni sau cele ale 
psihiatrilor, relative la aceiaşi indivizi. 

Pentru cercetarea validității concurente este necesară obţinerea 
scorurilor la criteriu aproximativ în acelaşi timp cu cele ale testului. 

Validarea predictivă'se aplică atunci când scorurile testului sunt 
folosite pentru a prezice valorile pe care o anumită variabilă le va avea într-un 
viitor mai mult sau mai puţin apropiat. Asemenea teste se utilizează de obicei 
la admiterea în şcoli sau la selecţia profesională, pentru a-i alege pe acei 
candidaţi care au şanse mari ca la sfârşitul cursurilor sau după ocuparea postului 
să obţină performanţe bune. | 

De exemplu, pentru estimarea validității predictive a unui test utilizat 
în selecţia profesională se calculează coeficientul de corelaţie liniară între 
scorurile testului, administrat cu ocazia finalizării unui curs de pregătire 
profesională, şi măsurile performanţelor obţinute de aceleaşi persoane după un 
anumit timp, în care au avut posibilitatea să aplice cunoştinţele respective. 

Trebuie subliniat faptul că validitatea predictivă se cercetează folosind 
loturi neselectionate. Aceasta înseamnă că toate persoanele cărora li s-a 
administrat testul vor urma acelaşi tratament şi vor fi prezente la evaluarea 
variabilei criteriu. În acest fel se asigură ca în lotul de subiecţi care serveşte la 
compararea testului cu criteriul să existe atât scoruri mari la test, cât şi scoruri 
mici. Nu totdeauna se poate realiza aşa ceva. Este greu de acceptat, de exemplu, 
ca să fie angajate toate persoanele care se prezintă la selecţia profesională sau 
ca decizia referitoare la angajare să se ia la întâmplare. 

Atunci când testul va fi utilizat pentru a face predicții, este necesar ca, 
alături de coeficientul de validitate al testului să se determine şi ecuaţia de 
regresie 
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valoarea criteriului = f (scor la test) 
Aceasta permite să se estimeze rezultatul pe care îl va obţine la criteriu fiecare 
persoană, cunoscând scorul său la test. De exemplu, dacă relaţia dintre media 
de absolvire a facultăţii, F, şi media obţinută la admiterea în facultate, A, poate 
fi scrisă sub forma 
F = 0.3 + 0.94 
atunci este de aşteptat ca o persoană care a fost admisă în facultate cu media 8. 5 
să termine facultatea cu media 
F = 0.3 + 0.9 x 8.5 = 7.95 


9.4.2. Problema restrângerii mulţimii 


Deosebirea esenţială dintre cele două tipuri de validări relative la 
criteriu nu constă în lungimea intervalului de timp dintre administrarea testului 
şi înregistrarea rezultatelor criteriului, ci în faptul că validarea concurentă - 
utilizează un eşantion de populaţie selecționat (personal angajat deja sau 
studenţi admişi în facultăţi). Apare aici următoarea problema, denumită 
restrângerea mulţimii, care face ca validarea concurentă să nu poată furniza 
totdeauna informaţii corecte asupra capacităţii predictive a testului: 

„Lotul de persoane utilizat la calculul coeficientului de validitate provine 
din populaţia asupra căreia ar fi trebuit să se facă predicția, dar până în 
momentul când se înregistrează valorile variabilei criteriu el a fost supus deja. 

-la două selecţii. 

(1) Pe de o parte, au fost retinuti.din eşantionul iniţial tf cei care au 
obţinut rezultate bune la criteriu (de exemplu, cei care ay avut note mari la 
admiterea în facultate). Dacă acest criteriu măsoară acelaşi lucru ca şi testul, 
atunci persoanele rămase sunt cele care vor obţine la test scoruri mai mari decât 
ar fi realizat cei respinşi. 

(2) Pe de altă parte, au fost eliminaţi pe parcurs cei cu per eta 
şcolare sau profesionale slabe, adică cei cu valori mici la variabila criteriu: 
utilizată în studiul validității. Este posibil să fi fost înlăturați prin promovare, şi 
cei cu valori foarte mari la criteriu. 

Deci, pentru lotul considerat, atât mulţimea scorurilor testului cat şi | 
mulţimea valorilor criteriului reprezintă restrangeri ale mulțimilor 
corespunzătoare care s-ar fi obţinut pentru întreaga populaţie. În consecinţă, 
coeficientul de corelaţie liniară calculat pe baza persoanelor selecţionate diferă 
de cel care ar fi rezultat lucrând cu întreaga populaţie şi care ar fi fost util pentru 
aprecierea valorii predictive a testului. 
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Exemplu. 

Să considerăm un lot forinat din 105 persoane care au răspuns la un test 
de capacitate de organizare, ale cărui scoruri posibile sunt 1, 2, 3, 4 şi 5. Fiecare 
subiect a fost evaluat în privința capacităților sale stanagenale, primind o nota 
cuprinsa intre 1 si 5. 

Rezultatele obţinute de persoanele din lot sunt notate în următorul tabel 
de. frecvenţe: 


Scorul „ Valoarea criteriului 
testului | 


Pe întregul lot, coeficientul de corelaţie liniară între test şi criteriu are 
valoarea 0.520, semnificativă la pragul p=0.001. 

Dacă din lot au fost reţinuţi doar cei 45 de subiecţi care au salient la 
test cel putin 4 puncte, atunci coeficientul de corelaţie liniară între test şi criteriu 
este egal cu 0.026, fiind nesemnificativ la pragul p=0.05. 

Daca din lot au fost eliminate persoanele care au fost evaluate cu note ` 
mai mici decât 4, atunci pentru cele 39 de persoane rămase coeficientul de 
corelaţie liniară dintre test şi criteriu ia valoarea -0.095, fiind nesemnificativ la 
pragul p=0.05. 

Pentru 31 de persoane care au primit cel puţin nota 4 la evaluare şi au 
obţinut cel putin 4 puncte la test coeficientul de corelaţie între test şi criteriu este 
egal cu 0.148, fiind nesemnificativ la pragul p=0.05. 


9.4.3. Interpretarea coeficientilor de validitate 
Hull (Guilford, 1965) a impus conditia ca un test sa fie utilizat in 


practică doar daca are un coeficient de validitate mai mare decât 0.45. Această 
„cerinţă este însă greu de realizat. Un test bun rareori poate da, cu un criteriu 
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important, un coeficient ge corelație mai mare decât 0.5 (Murphy, Davidshofer, 
1991). 

În experiența obişnuită, valoarea coeficientului de validitate al testelor 
utilizate pentru a face predicții este cuprinsă între 0 si 0.60, în majoritatea 
cazurilor fiind situată în partea inferioară a intervalului [0, 0.60] (Guilford, 
1965). : | 

Constatarea că, în general, EI N gută persoane variază 
de la o situaţie la alta a condus la concluzia că valoarea coeficientului de 
validitate al testelor de personalitate : administrate în scopul predictiei unei 
acţiuni nu poate fi mai mare decât 0.4 (F under, 1983). 

A O posibilitate de a stabili dacă validitatea relativă la criteriu a unui test | 
este sau nu acceptabilă porneşte de la eroarea maximă acceptată în estimarea 
valorilor criteriului şi se bazează pe formula de calcul a erorii standard de 


estimare (Gregory, 1992): | Pi 
ES Ola | 9.43.1 ) 


unde: 

ES. = eroarea standard de estimare, care reprezintă marginea superioară a 
; erorii de estimare a valorilor criteriului prin ecuatia de „regresie liniară; 

CARNER nE abaterea standard a valorilor criteriului; 

rq = coeficientul de corelatie liniară între test şi criteriu; 


"ES, ajută să se răspundă la întrebarea "Cât de precis poate fi prezisă 
performanţa la criteriu, pornind de la scorurile testului?" * 

Presupunând că repartiţia de frecvenţe a valorilor criteriului urmează 
„legea: normală şi că ecuaţia c de regresie a criteriului (c) taia de test © este: 
| c=a+bt | 
există şanse de 95% ca valoarea criteriului pentru o persoană care a bilinir 
„scorul to la test să se afle în intervalul: 

[atbt-1. 96 Sess atbtyt1.96ES,«1] 

Cu cât coeficientul de validitate al testului, r„, este mai mare, cu atât 
eroarea standard de estimare este mai mica, iar predictia realizata cu ajutorul 
testului este mai precisa. 


9. 4. 4. Factori care afectează He coeficientilor de validitate 


Valoarea coeficientului de data al unui test este ie lat nu 
numai de test, ci şi de criteriul utilizat şi de populaţia căreia i se administrează 
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testul. Amintim cativa dintre factorii care afecteaza Mia late testului (adaptare 
după Aiken, 1994 ŞI ae 1997). 


“A. Unele caracteristici ale populației, precum sexul, vârsta sau chiar anumite 
trăsături de personalitate, acţionează. ca variabile moderatoare, modificând 
relaţia dintre criteriu şi test. Subiectii se împart în grupe, în funcţie de valorile 
variabilei moderatoare, iar valoarea coeficientului de validitate al testului se 
poate schimba de la o grupă la alta. 

În general; coeficienţii de validitate sunt mai mici în grupele mai 
omogene, adică in grupele în care scorurile testului sau valorile criteriului 
variază puţin. 

Atunci când valoarea coeficientului de validitate al unui test este 
scăzută, iar ceea ce se cunoaşte despre test si despre criteriu nu oferă o 
explicaţie, trebuie să se verifice dacă nu există o variabilă moderatoare care se 
interpune între criteriu şi test. 

Întrucât validitatea unui test este denghientt si de grupul de stiti, 
ori de câte ori se constată că un test nou este valid faţă de un anumit criteriu, 
este necesar să se efectueze o validare suplimentară (cross-validation), folosind 
acelaşi criteriu, dar un alt eşantion de subiecţi, proveniţi din aceeaşi populaţie 
ca şi primul: Doar dacă şi în acest caz testul se dovedeşte a fi valid, se poate 
recomanda utilizarea sa în aniridi 


B. La fel ca si fi delitatea, Spalat relativă la criteriu este e influențată de 
lungimea testului. 

‘Daca testul este format din itemi paraleli şi se modifică lungimea 
testului prin eliminarea unor itemi sau prin adăugarea de itemi paraleli, atunci 
coeficientul de validitate al testului obţinut, relativ la acelaşi criteriu pentru care 
a fost calculat coeficientul de i ale y al testului original, e este yi de formula 
(Burisch, 1997); 


| pi 


Meee (9.4.4.1). 


[Ia pie 


unde: 

r; = coeficientul de validitate al testului nou; 

Yo = coeficientul de validitate al testului original; 

k = raportul dintre numărul ia itemi î în testul nou şi nan pii itemi în 
testul original; 

FE = coeficientul de fidelitate al testului original. 
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Se constată că prin dain dei itemi paraleli la un test validitatea 
testului creşte. 


C. Validitatea testului este dependentă şi de validitatea criteriului ca şi măsură 
a variabilei la care se referă testul. | 

Dacă valorile variabilei criteriu sunt influențate de scorurile testului, 
se spune că a avut loc o contaminare a criteriului. Aceasta are ca efect cr ieyeerea 
artificiala a validitatii relative la criteriu a testului. 

În majoritatea cazurilor, contaminarea criteriului se produce atunci când 
testul şi criteriul au itemi comuni sau în acele situaţii când valorile criteriului 
sunt rezultatul unor evaluări făcute de experţi, iar aceştia cunosc scorurile 
obţinute de către subiecţi la test şi, intenţionat sau nu, sunt influenţaţi de ele în 
formularea îi ii 


D. ‘Un alt factor’: care ini flogițează mărimea coeficientului de validitate este 
frecvenţa relativă în populaţie a persoanelor care prezintă caracteristica la care 
se referă testul (base rate). Atunci când comportamentul pe care testul îl măsoară 
sau îl prezice este foarte rar întâlnit (precum psihoticismul sau suicidul), 
vant relativă la criteriu este de obicei scăzută. 


E. Validitatea 1 unui test este ch gatit de fidelitatea sa. daia dacă aeM 
si beM sunt două măsurători paralele, iar ceM este o măsurătoare arbitrară, 
atunci are loc următoarea inegalitate: 


pă, APD) | Bei Koda (9.4.4.2) 


Aceasta se interpretează astfel: coeficientul de validitate al unui test 
aeM relativ la orice criteriu ceM nu poate depăşi indicele de fidelitate al 
testului a. Înseamnă că, dacă un test nu este fidel, validitatea sa relativ la orice 
criteriu nu poate fi mare. Dar, o valoare mare a indicelui de fidelitate nu 
garantează o validitate mare. : 


F. Uneori, coeficientul de validitate ia o valoare scăzută nu din cauza testului, 
ci a criteriului utilizat. Aşa se întâmplă atunci când: . 

e criteriul are o fidelitate scăzută; 

e intervalului de valori pentru criteriu este restrâns, neacoperind decât o parte 
din mulţimea valorilor posibile; 

e repartiția de frecvențe a valorilor criteriului nu este normală; 
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e valorile criteriului nu sunt acordate sau notate corect, fie din cauza unor 
factori care ţin de evaluator (oboseală, neatentie, incompetenta sau părtinire), fie 
pentru că respectivul criteriu este dificil de măsurat. 


9.5. CÂTEVA IDEI IMPORTANTE DESPRE VALIDITATEA 
TESTELOR 


La alegerea strategiilor de validare a unui test, precum şi la interpretarea 
coeficienţilor de validitate, este util să se ia în considerare şi următoarele păreri 
(adaptare după Messick, 1981 şi Hammond, 1995): 


A. Validitatea unui test este dependentă de scopul pentru care acesta este folosit 

şi de populaţia căreia i se administrează testul. Nici un test nu este valid în orice 
situaţie de utilizare. Concluziile desprinse dintr-un studiu privind validitatea 
unui test sunt influențate şi de metodele aplicate în cercetare. 


B. Există deja metode pentru validarea testelor: analiza de itemi, analiza 
factorială, calculul coeficienţilor de corelaţie dintre test şi diverse criterii etc. 
Alegerea strategiei de validare pentru un anumit test trebuie să fie determinată 
de scopul pentru care se va utiliza testul şi de cerinţele formulate de cel care a 
solicitat examinarea psihologică în cadrul căreia se intenţionează să se 
administreze testul respectiv, 


C. Validitatea unui test nu poate fi estimată printr-un singur coeficient, ci se 
deduce din acumularea dovezilor empirice şi conceptuale. 

Standards for Educational and Psychological Tests din 1974 atrag 
atenţia că "validitatea nu se măsoară, ci se deduce". Manualul testului trebuie 
să conţină valorile mai multor coeficienţi de validitate, calculati pentru utilizări 
„diferite ale testului sau pentru populaţii diferite. În cazul unei aplicări particulare 
a testului nu se va lua în considerare un singur coeficient, ci prin analiza lor 
globală se va aprecia dacă utilizarea testului este "adecvată" sau 
"nesatisfăcătoare". | 

Pentru a sublinia ideea că este greşit să se spună "testul are validitate 
(de un anumit tip)", Standards for Educational and Psychological Tests din 
1985 modifică terminologia utilizată in legătură cu validitatea. Astfel, ele 
înlocuiesc denumirile cunoscute ale "tipurilor" de validitate cu următoarele 
"etichete" atribuite strategiilor de validare: "dovezi ale validității relative la 
conţinut", "dovezi ale validității relative la construct" şi "dovezi ale validității 


181 


relative la criteriu". Prin urmare, faptul că scorurile testului folosit ca predictor 
corelează liniar semnificativ, la un prag de probabilitate fixat, cu valorile unui 
criteriu nu reprezintă o evaluare a validității relative la criteriu şi nu permite să 
se afirme că "testul are validitate relativă la criteriu", ci doar constituie una 
dintre dovezile validității relative la criteriu a testului. 


D. Strategiile de validare se aplică încă din faza de construcţie a testului. Ele se 
repetă până când se obţine un test acceptabil în ceea ce priveşte lungimea, 
fidelitatea, validitatea şi uşurinţa în administrare, cotare şi interpretare. 
Procedeele da validare sunt următoarele; 


a. th cazul testelor care măsoară constructe, se aleg şi se introduc în test 
itemi din două categorii: unii consideraţi a fi reprezentativi pentru domeniul 
constructului şi unii despre care se presupune că nu au nici o legătură cu 
constructul. După administrarea testului sunt reţinuţi doar acei itemi care se 
aseamănă între ei în privinţa răspunsurilor obţinute de la subiecţi. Se analizează 
conţinutul acestora pentru a se vedea dacă, într-adevăr, ei exemplifică teoria 
constructului ce trebuie măsurat şi dacă se deosebesc de itemii consideraţi a fi 
nerelevanti pentru construct. 


b. În cazul testelor care vor fi validate relativ:la conţinutul lor; se 
introduc în test doar itemi care acoperă domeniul de conţinut al testului. După 
administrarea „testului, se rețin ‘itemii la. care s-au obţinut masi ai 
care se ER la acelaşi domeniu de conţinut sau dacă răspunsurile obţinute la 
aceşti itemi se deosebesc semnificativ între două Bree contrastante de subiecti. 


c. În cazul testelor care vor fi utilizate pentru a face predicții sau a lua 
decizii, pentru care se poate alege un criteriu de validare, după administrarea 
testului se retin doar itemii care se comportă fata de acest criteriu aşa cum se 
doreşte să se comporte întregul test. 


E. Validarea unui test este un proces care trebuie repet mereu pe parcursul 
perioadei în care acesta este utilizat, întrucât datele care se acumulează, 
provenite din observaţii clinice şi din diverse proiecte de cercetare, permit ca 
interpretarea propusă iniţial pentru scorurile testului să A fie îmbunătăţită si 
rafinata. 

Ori de câte ori se face o modificare ortini într-un test în ceea ce 
priveşte formatul, limbajul, conținutul 1 sau instrucţiunile de administrare, testul 
va fi validat din nou. 
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CAPITOLUL 10 
DIF ICULTATEA ŞI SEN SIBILITATEA UNUI TEST. 
PSIHOLOGIC 


Aceste proprietăţi sunt discutate, de obicei, atunci când se verifică dacă 
un test este adecvat-unui lot de persoane. Elementele analizate în acest scop . 
sunt, în majoritatea cazurilor, forma repartitiei de frecvenţe şi valorile indicilor 
statistici (media, dispersia) pentru scorurile realizate la test de lotul respectiv sau 
de un eşantion asemănător acestuia. 


10.1. DIFICULTATEA UNUI TEST PSIHOLOGIC 


Se consideră că un test este dificil dacă un număr mare de persoane 
obţin scoruri mici, este uşor dacă majoritatea scorurilor realizate sunt mari şi 
este potrivit lotului dacă scorurile sunt repartizate pe un interval de valori destul 
de mare, de obicei fiind grupate în jurul mediei. În primul caz, repartiţia de 
frecvenţe pentru scorurile obţinute la test este asimetrică la stânga (are forma 
literei i) (figura 10.1.1a), in cel de-al doilea caz este asimetrică la dreapta (are 
forma literei j) (figura 10.1.1.b), iar în ultimul caz este simetrică fata de verticala 
ridicată în punctul corespunzător mediei scorurilor (figura 10.1.1c). De obicei 
se apreciază că un test este adecvat unei populaţii dacă repartiţia scorurilor sale 
urmează legea normală. 

O asemenea analiză a dificultății este posibilă nu numai pentru testele 
de eficienţă (de aptitudini şi de cunoştinţe), ci şi pentru chestionarele de 
personalitate, deşi în cazul acestora din urmă termenul E mai nu pare 
potrivit. 

Dificultatea unui “test, apreciata pe i paz repartitiei de frecvenţe a 
scorurilor rezultate în urma unei administrări, este determinată atât de conţinutul 
testului, cât şi de caracteristicile lotului de subiecţi.” 

Atunci când itemii care alcătuiesc testul sunt puternic corelati între ei, 
fiecare persoană va da răspunsuri cotate identic sau asemănător, pentru că îi va 
rezolva pe toţi corect (respectiv, greşit) sau va alege răspunsul care corespunde 
valorii mari (respectiv, mici) a variabilei măsurate de test. Prin urmare, în orice 
lot de indivizi se vor obţine doar scoruri foarte mari şi/sau foarte mici. | 

Pentru un chestionar de personalitate cu itemi dihotomici este posibil 
ca populaţia căreia i se administrează testul să se împartă în două grupe: unii 
care la majoritatea itemilor dau răspunsul corespunzător scorului 1 şi alţii care 
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aleg răspunsul cotat cu 0. Se obţine, deci, o repartitie bimodala a scorurilor 
(figura 10.1.1.d).O asemenea situaţie poate să apară, de pildă, la o scală de. 
feminitate/ masculinitate, când răspunsurile la itemi se diferenţiază în funcţie de 
Sex. t 
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Frecventa 


Figura 10.1.1. 
Diverse repartitii de frecvente ale scorurilor unor teste 


Testele centrate pe criteriu produc, de obicei, repartitii asimetrice sau 
_ bimodale. Ele conţin itemi care verifică existenţa unor priceperi sau cunoştinţe 
“absolut necesare unui anumit scop (promovarea unui program de instruire, 
ocuparea unui post etc.). De exemplu, ele pot solicita rezolvarea unor exerciţii 
de aritmetică simple, la sfârşitul clasei întâi, sau executarea unei piese dificile, 
pentru ocuparea unui post care pretinde o calificare superioară. Utilizarea 
acestor teste nu urmăreşte ierarhizarea persoanelor, ci împărţirea lor în două 
categorii: "capabile" şi "incapabile" pentru scopul fixat. 

Un test de cunoştinţe, administrat aceloraşi indivizi în momente diferite, 
poate produce repartitii total deosebite ale scorurilor. 


Exemplu (adaptare după G. de Landsheere, 1975). 
| Să considerăm un test de cunoştinţe de statistică, destinat studenţilor 
anului I de la Psihologie. 

La începutul anului, majoritatea studenţilor nu cunosc principalele 
formule statistice utilizate la prelucrarea datelor experimentale; unii ştiu să 
calculeze media, mediana şi dispersia şi doar câţiva au lucrat cu coeficienţi de 
corelaţie. Rezultatele care s-ar obţine la test ar avea curba de repartiție 
asimetrică la stânga. | 

După trecerea examenului de "Psihologie experimentală şi analiza 
datelor”, majoritatea studenţilor cunosc şi aplică bine formulele statistice; unii 
au dificultăţi la aplicarea câtorva formule şi numai foarte puţini nu cunosc 
formulele. Acelaşi test de cunoştinţe ar avea curba de repartiție a scorurilor 
asimetrică la dreapta. l 
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În intervalul de timp delimitat de începutul anului şi sfârşitul sesiunii 
există, probabil, un moment în care cei mai conştiincioşi au învăţat mai mult, cei 
mai puţin interesaţi de statistică au rămas în urmă şi, dacă s-ar administra testul 
de cunoştinţe, curba de repartiție a scorurilor ar fi asemănătoare curbei normale. 

Schematic, evoluţia este prezentată în figura 10.1.2. 


Figura 10. 1. 2 
Cúrbele de repartiție pentru stno aceluiași test tde EER în 1 trei 
momente diferite 


10.2. SENSIBILITATEA UNUI TEST PSIHOLOGIC 


Puterea de discriminare sau sensibilitatea unui test este dată de 
capacitatea acestuia de a face distincție între persoanele examinate, în privința 
trăsăturii de personalitate sau a aptitudinii măsurate (Lafon, 1973), respectiv de 
a produce scoruri diferite pentru subiecții care se deosebesc între ei în privința 
caracteristicii măsurate de test (Kline, 1993). 

Piéron (1952) « considera ca puterea de discriminare a unui test este data 
de numărul claselor pe care le permite în cadrul unui grup. Cu cât numărul 
valorilor de scor obţinute de persoanele unui lot este mai mare, cu atât testul 
diferenţiază mai bine între indivizi. Dar, numărul de valori de scor rezultate în 
urma administrării testului depinde atât de test (de itemii componenți), cât şi de 
caracteristicile lotului (cât de mari sunt deosebirile dintre persoane în ut de 
variabilei măsurate sau prezise de test). 
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Atunci când cota brută a testului se obţine prin însumarea cotelor 
itemilor, este de aşteptat ca un test alcătuit din mulţi itemi să furnizeze mai 
multe valori de scor decât unul format dintr-un număr redus de itemi. Dar, aşa 
cum s-a arătat mai sus, dacă itemii sunt puternic intercorelati, există riscul de a 
se obţine doar scoruri foarte mari şi/sau foarte mici. 

Ausubel şi Robinson (1981) atrag atenţia asupra dependenţei dintre 
sensibilitatea testului şi forma repartiţiei scorurilor. | 

O repartiție a rezultatelor apropiată ca formă de curba normală, de 
exemplu, asigură o discriminare maximă la ambele capete ale scalei (unde sunt 
risipite puţine scoruri) şi o discriminare mai redusă la mijlocul scalei (unde se 
îngrămădesc laolaltă numeroase rezultate); o repartiție uniformă a scorurilor 
asigură o discriminare la fel de bună de-a lungul întregii scale. O repartiție 

asimetrică (în care un număr disproporționat de mare de rezultate se acumulează 
la un capăt al scalei) este extrem de discriminativă la capătul unde găsim puţine 
scoruri. "A 

Se deduce, deci, că un test discriminează cu atât mai bine în cadrul 
întregului lot de subiecţi, cu cât permite un număr mai mare de valori de scor şi 
cu cât repartiţia acestora este mai uniformă, | 

Pentru un test alcătuit din itemi dihotomici, cotati cu 0 şi 1, al cărui scor 
se obţine prin însumarea cotelor itemilor, o măsură a puterii de discriminare 
bazată pe forma repartitiei scorurilor obţinute la test, o reprezinta coeficientul 
lui Ferguson (Kline, 1993). Acesta se calculează cu ajutorul formulei: 


n 


6 = wy) (10.2.1) 
nN i=0 

unde: 

Ô -= coeficientul lui Ferguson; 

n = numărul itemilor testului; 

N = numărul de subiecţi cărora li s-a administrat testul; 

fi = frecvenţa scorului i, i=0,1,...,n. 


Coeficientul lui Ferguson ia valori între 0 (atunci când apare un singur 
scor) şi 1 (în cazul repartitiei uniforme). Repartiția legii normale furnizează un 
coeficient egal cu 0.93. Se consideră că un test are o capacitate de discriminare 
bună dacă 6 ia o valoare mai mare decât 0.9. | 


Există o, legătură puternică între dificultatea unui test şi sensibilitatea 


sa. Atunci când testul este foarte greu sau foarte uşor pentru un grup de 
persoane, rezultatele. se concentrează spre una dintre extremităţile intervalului 
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de valori posibile pentru scoruri şi, deci, nu sunt evidenţiate deosebirile dintre 
indivizi. 

Se impune o observaţie: forma repartitiei de frecvenţe a scorurilor este 
dependentă atât de forma repartitiei de frecvenţe a valorilor variabilei măsurate, 
în grupul testat, cât şi de test (de caracteristicile psihometrice ale itemilor 
acestuia). | 


Exemplu (Albu, pinza 1992a). 
S-a considerat un test alcătuit din patru itemi, ale căror funcţii. 
caracteristice au expresia analitică: 


PY) = 


ite. 
em 
l+e -1,7a(y-b) 


S-a presupus ca pentru o grupa us piect variabila măsurată de test are 
o repartiție simetrică. 

Cu ajutorul calculatorului s-a determinat repartiția de frecvențe a 
scorurilor testului pentru diverse alegeri ale parametrilor a; b şi c. In figura 
10.2.1 sunt prezentate două dintre repartitiile de frecvențe obținute. Se constată 
că între forma repartitiei variabilei măsurate in esantionul de subiecți si forma 
repartitiei scorurilor realizate pot exista deosebiri importante. 


Atunci când repartiția de frecvențe a scorurilor obținute are o asimetrie 
puternică, dificultatea şi' sensibilitatea testului pot fi analizate identificând 
scorurile care apar mai frecvent. În celelalte cazuri, însă, pentru a putea aprecia 
corect aceste proprietăţi ale testului este necesar să se calculeze principalii 
indicatori statistici ai scorurilor şi să se compare, folosind teste statistice, 
valorile lor cu cele înregistrate în manualul testului sau obţinute în alte ocazii. 

Media rezultatelor aduce informaţii despre nivelul general al variabilei 
măsurate de test. Dacă media grupului examinat este semnificativ mai scăzută 
(respectiv, mai ridicată) decât cea a populaţiei care a servit la etalonarea testului 
se deduce că testul este prea dificil (respectiv, prea uşor) pentru lotul respectiv 
şi interpretarea scorului unei persoane prin raportare la etalonul din manual ar 
putea conduce la concluzii greşite. 

e Abaterea standard serveşte la aprecierea omogenitatii - grupului 
examinat. O valoare mică a abaterii standard este caracteristică unui lot de ` 
subiecţi foarte asemănători între ei în privinţa variabilei măsurate de test. În 
acest caz, testul nu este sensibil, nu realizează o diferenţiere bună între persoane. 
Valorile mari ale abaterii standard se întâlnesc în loturile neomogene, cu 
deosebiri mari între cei testati. Dar atunci media scorurilor este mai putin 
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ilustrativă pentru nivelul lotului, întrucât rezultatele obţinute sunt împrăştiate 
într-un interval destul de mare în jurul valorii medii. 


01234 scor 


PRASAT 


01234 scop 
“yr 


Repartitia variabilei masurate Repartitia scoruri lor 


Figura 10.2.1 
Comparaţie între repartiţia valorilor variabilei măsurate de test t şi 
repartiţia scorurilor testului 


Trebuie observat că nici un test nu poate fi atât de sensibil încât 
totdeauna două persoane deosebite în privinţa variabilei măsurate de test să 
obţină scoruri diferite. Aceasta, în primul rând, deoarece trăsăturile psihice, 
aptitudinile, cunoştinţele şi celelalte caracteristici măsurate de teste sunt 
variabile continue, în timp ce scorurile testelor sunt variabile discrete, având 
doar un număr finit de valori. Prin urmare, nici un test nu poate stabili o 
corespondenţă biunivocă între variabila măsurată şi scorurile pe care le produce. 
Oricât de deosebiți între ei ar fi indivizii dintr-un lot examinat, dacă numărul lor 
este mai mare decât numărul de valori de scor pe care le poate furniza testul, vor 
exista persoane cu acelaşi scor, deci între care testul nu diferenţiază. 
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Pe de altă parte, scorul realizat de o persoană la un test este afectat de 
diverse erori (erori cauzate de starea de oboseală a subiectului, de condiţiile în 
care s-a făcut examinarea şi cotarea sau chiar erori de construcţie a testului etc.). 
Din acest motiv, la fiecare nivel al variabilei măsurate, £, sunt posibile, cu 
probabilitati diferite in general, mai multe valori de scor. 
Dacă testul este bine construit, atunci scorul cel mai probabil variază 
nedescrescător faţă de variabila măsurată. Testul realizează în acest caz o 
„descompunere a axei reale - pe care variază variabila măsurată - în intervale | 
disjuncte, pe fiecare interval scorul cel mai probabil fiind acelaşi. Numărul 
acestor intervale nu poate fi mai mare decât numărul de valori de scor pe care 
le poate furniza testul. Mai multi indivizi care au valori ale variabilei măsurate 
de test diferite între ele dar situate în acelaşi interval au şanse mari să obţină 
acelaşi scor, egal cu scorul cel mai probabil. Deci, testul nu va discrimina între 
Ck T 


Din cele arătate până acum se deduce că puterea de discriminare a unui 

test estelegata de | ipay EE iii i ty | 
e numărul intervalelor pe care scorul cel mai probabil este acelaşi; 
e lungimile acestor intervale; 
e poziţiile intervalelor pe'axa reală. | | 

„Un test va discrimina bine între indivizii care au valori ale variabilei 
măsurate de test plasate în acea zonă a axei reale în care există un număr mare 
de intervale, de lungimi mici. ` dl Mn: 


10.3. INFLUENŢA CARACTERISTICILOR ITEMILOR 
ASUPRA DIFICULTAȚII ŞI A SENSIBILITATII TESTULUI 


În continuare vom arăta, prin câteva exemple, cum depind dificultatea 
şi sensibilitatea unui test de caracteristicile itemilor componenți. 

Ne referim doar la teste alcătuite din itemi care măsoară aceeaşi - 
variabilă, dihotomici, cotati cu 1 (pentru valori mari ale variabilei) şi 0 (în cazul 
valorilor mici ale variabilei). 

Pentru un asemenea item, indicele de dificultate este dat de frecvenţa 
relativă a persoanelor care au obţinut scorul 1 în mulţimea subiecţilor care au 
răspuns la item. El arată cât de dificil este itemul pentru lotul de persoane testat. 

În toate exemplele analizate itemii sunt valizi, în sensul că pentru 
fiecare item scorul 0 este obţinut de persoane care la variabila măsurată de test 
au valori mai mici decât persoanele care obţin la item scorul 1. 
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Să considerăm 10 persoane S1 525... 19 Care au răspuns la 6 itemi, i}, 
i»...iẹ Scorul testului format din aceşti itemi se obţine prin însumarea scorurilor 
itemilor. 

Notăm cu ¢,, ¢3,..., Ci valorile variabilei măsurate de test pentru cele 10 
persoane şi presupunem că între ele există relaţiile: 

i Cp Ch Re Se) | (10.3.1) 


Exemplul 10.3.1 
-© Scorurile obţinute de subiecţi la itemi şi la testul compus din ei sunt 

notate în Tabelul 10.3.1. | 

Se constată că dacă itemii componenți au aceeaşi dificultate şi sunt 
intercorelaţi, testul nu discriminează bine între subiecţi. 

Alegerea unor itemi valizi cu aceeaşi valoare a indicelui de dificultate 
micşorează numărul scorurilor distincte obţinute la test. Acest lucru se observă 
şi din următorul exemplu. | 


Tabelul 10.3.1 
Scorurile itemilor i), 7,,.:.,i, pentru subiecţii 5), 5,,...,819 


Persoana 


Exemplul 10.3.2 T 
Scorurile obținute de subiecți la itemi şi la testul compus din ei sunt 
notate în Tabelul 10.3.2. 
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Tabelul 10.3.2 
Scorurile itemilor i), î3,...,ig pentru subiecţii S}, 52,...,5 79 


Persoana 


Ss} i 
0.6 
ig 0|0|0|0 ae 
Scor | FP 
total 
Din cele 7 valori posibile de scor la test s-au obținut doar 3. Scorurile 
testului nu discriminează între subiecții cu valori mari ale variabilei măsurate 
(care obțin, toți, scorul maxim 6) şi nici între cei cu valori mici ale acestei 


variabile (care obţin, toţi, scorul minim, 0). Cauza o constituie faptul că toţi 
itemii componenți corelează între ei şi sunt de dificultate medie. 


Exemplul 10.3.3 | | 
| Scorurile obţinute de subiecţi la itemi şi la testul compus din ei sunt 
notate în Tabelul 10.3.3. 

Din cele 7 valori posibile de scor la test s-au obţinut 5: 0, 1, 3,5şi6. 
Scorurile testului sunt repartizate aproximativ echidistant în intervalul scorurilor 
posibile, [0,6], datorită faptului că şi dificultăţile itemilor care compun testul 
sunt aproximativ echidistante în intervalul [0,1]. Testul format este de dificultate 
medie. 
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Tabelul 10.3.3 


Scorurile itemilor i}, i,,...,i, pentru subiecţii S}, 52,...,5 j9 


Persoana 


Cu totul alta este situaţia în următorul exemplu. 


Exemplul 10.3.4 


Tabelul 10.3.4 


“Scorurile itemilor i}, i}...,i pentru subiecții 5), 55.:.,549 


Persoana 
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Scorurile obtinute de subiecti la itemi si la testul compus din ei sunt 
notate în Tabelul 10.3.4. -Și în acest caz s-au obţinut tot 5 scoruri la test, dar 
acestea sunt mai apropiaie de scorul maxim posibil decât în exemplul precedent, 
testul este mai uşor. Aceasta, din cauza faptului că itemii care compun testul au 
indicele de dificultate mai mare decât în exemplul precedent. 

Pentru a obţine cât mai multe valori de scor se aleg itemi care să aibă 
indici de dificultate diferiţi şi repartizaţi cât mai uniform pe intervalul [0,1], ca 
în exemplul următor. i 


Exemplul 10.3.5 ` 
Scorurile obținute de subiecți la itemi si la testul compus din ei sunt 
notate în Tabelul 10.3.5. 


Tabelul 10.3.5 | 
Scorurile itemilor i}, i,,...,i, pentru subiecţii S}, 52.510 


Persoana 


De data aceasta apar toate scorurile TENE ale testului, iar repartitia lor 
de frecvente este cuprinsa intre repartiţia uniformă şi cea normală. 
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| CAPITOLUL 11 i 
INFORMAȚII DESPRE TESTELE PSIHOLOGICE 


11.1. MANUALELE TESTELOR PSIHOLOGICE 


În mod obişnuit, orice test psihologic care este pus în circulație, pentru 
a fi utilizat în practică, este însoțit de două manuale: 

e un manual tehnic, care conține informaţii despre felul în care a fost 
construit testul, rezultatele analizei de itemi, valorile coeficienţilor de fidelitate 
şi concluziile studiilor de validitate; 

e un manual de utilizare, care cuprinde instrucţiunile pentru 
administrarea testului şi indicaţii pentru interpretarea rezultatelor. | 

Standards for Educational and Psychological Tests din 1985 
recomandă ca, pe lângă furnizarea acestor informaţii, manualele testelor. 
psihologice să îndeplinească şi următoarele sarcini (Gregory, 1992): 

a. să descrie motivele construirii testului şi să prezinte recomandări 
pentru utilizarea lui; , | 

b. să atragă atenţia asupra eventualelor riscuri de folosire greşită a 
testului; | | 
c. să citeze studii reprezentative privind utilizarea testului în situaţii 
obişnuite sau specifice; ha | 

d. să prezinte condiţiile (de studii, de experienţă etc.) pe care trebuie să | 
le îndeplinească persoana care administrează testul şi cea care interpretează 
rezultatele acestuia; | 


ego w e 


11.2. INFORMAȚII NECESARE PENTRU ALEGEREA UNUI 
TEST PSIHOLOGIC | 


„ Atunci când sunt disponibile mai multe teste care servesc aceluiaşi scop, 
alegerea celui mai potrivit dintre ele impune luarea în considerare a unor criterii | 
de ordin tehnic, practic şi economic. Faptul că un test este un instrument de 
măsură sau de predictie bun, adecvat lotului care urmează să fie examinat şi 
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accesibil ca pret, nu surmontează dificultăţile legate de administrarea şi de 
cotarea sa, ori de interpretarea rezultatelor. 

Principalele aspecte care pot influenţa alegerea unui test psihologic sunt 
cuprinse în lista următoare (adaptată după Gronlund, 1967; Thorndike, Hagen, 
1961): 

A. Date Pa identificarea testului: 
e denumirea testului; 

e autorii testului (numele şi, eventual, autoritatea lor ştiinţifică); 
e versiunea testului; 
e data punerii în circulaţie; 
e denumirea firmei care difuzează testul. 
+. B. Informaţii generale despre test: 
e funcţia testului: ce măsoară şi cum este definit constructul măsurat sau ce 
performanţe prezice; 
e caracteristicile persoanelor care pot fi examinate cu acest test: zona 
geografică, vârsta, nivelul de şcolarizare etc.; 
e timpul necesar pentru administrarea testului; 
e modul de administrare: creion-hârtie, cu aparate, cu ajutorul calculatorului 
ECN rae 
e modul de calcul al scorurilor: manual, cu calculatorul etc.; 
e cum se interpretează scorurile testului: obiectiv sau subiectiv; 
e dacă există forme paralele ale testului, disponibile; 
e costul achiziţionării testului; 
e costul administrării testului pentru o persoană. 

C. Caracteristici tehnice: 

e calitatea itemilor testului; dacă folosesc o terminologie cunoscută celor care 


„vorfi examinaţi cu acest test, dacă sunt lipsiţi de ambiguitate, dacă în itemii cu 


alegere multiplă răspunsurile greşite propuse nu sunt banale; 

e validitatea: modul in care a fost studiată validitatea si constatările făcute; _ 
e fidelitatea: ce coeficienţi au fost calculati, în ce condiţii şi ce rezultate s-au 
obţinut; 

e norme disponibile: ce tipuri de norme se utilizează, ce populaţii au fost 
folosite pentru etalonare, dacă există norme potrivite pentru populaţia căreia 
urmează să îi fie administrat testul. 


D. Caracteristici practice: 
e dificultăţi la administrare: dacă sunt necesare aparate sau condiţii speciale; 
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e dificultăţi la calculul scorurilor: dacă se aplică formule complicate si nu există 
program pentru calculul automatizat al scorurilor sau dacă este un test subiectiv, 
care necesită o interpretare calitativă a răspunsurilor subiecţilor; 

e dificultăţi la interpretarea scorurilor: dacă persoana care urmează să 
interpreteze scorurile trebuie să îndeplinească anumite condiţii de studii sau de 
„experienţă; | 

e calitatea manualului testului: dacă există suficiente informaţii pentru utilizarea 
testului şi dacă acestea sunt clare. 

E. Alte consideraţii: 

e părerile unor persoane care au utilizat deja testul. 
/ 

Majoritatea acestor informaţii se găsesc în manualele testului. Cele 
referitoare la existenţa formelor paralele ale testului sau a programelor pentru 
administrarea, cotarea şi/sau interpretarea rezultatelor testului se pot obţine din 
reviste de specialitate. Informaţiile privind distribuitorii testului, costul de 
achiziţie şi cel de utilizare (de administrare şi/sau de cotare) sunt specifice 
fiecărei ţări. | 

Foarte multe reviste publică articole despre validitatea şi fidelitatea 
testelor. Cel mai bun mijloc pentru identificarea lucrărilor referitoare la un 
anumit test îl constituie revista de rezumate Psychological Abstracts. 

Se pot obţine multe informaţii despre testele psihologice din 
următoarele reviste: 

e Advances in Personality Assessment; 

e The Journal of Psychoeducational Assessment; 

e Psychology in the School; 

© Educational and Psychological Measurement; 

e Psychological Assessment: A Journal of Clinical and Consulting 

Psychology, ` 

e The Journal of Clinical Psychology; 

e The Journal of Personality Assessment. — 

In Revista de Psihologie şi în Revue Roumaine de Psychologie sunt 
publicate articole despre studiile efectuate în România asupra unor teste 
psihologice originale sau traduse. 


| CAPITOLUL 12 | 
CONSTRUIREA TESTELOR PSIHOLOGICE 


1241, ALGORITMUL GENERAL DE CONSTRUIRE A 
TESTELOR << | 


12.1.1. Prezentarea pasilor algoritmului de construire a unui test 


În general, construirea unui test psihologic sau a unei scale dintr-un test 
se desfăşoară in mai multi paşi, nesecvential, cu reveniri repetate pâna la 
realizarea calităţilor. dorite (fidelitate, validitate, putere de discriminare, 
dificultate). Algoritmul general de construire a unui test este redat în figura 
2 Ma Yu i 

Conţinutul tuturor paşilor algoritmului este determinat de direcţiile 
stabilite la primul pas, în special de scopul - teoretic şi practic - căruia trebuie 
să îi servească elaborarea testului. În funcţie de acesta se formulează itemii, se 
alege metoda de construire a testului şi se alcătuieşte o primă variantă a testului. 

Gruparea de itemi formată se administrează unui eşantion de persoane 
extras din populaţia căreia îi este destinat testul. Se analizează răspunsurile 
obţinute la fiecare item, se identifică itemii necorespunzători (de exemplu, cei 
la care majoritatea persoanelor au răspuns identic sau, în cazul itemilor cu 
alegere multiplă, cei la care un răspuns greşit s-a dovedit a fi mai atractiv pentru 
subiecţi decât răspunsul corect) şi se caută cauza, pentru a vedea dacă este legată 
de item, de eşantionul de subiecţi sau de modul de administrare a itemilor. 
Analiza cauzelor erorilor poate scoate la iveală deficienţe ale unor itemi care în 
urma analizei statistice a rezultatelor păreau a fi bine construiți (de exemplu, la 
un item s-a răspuns greşit pentru că un alt item conţine informaţii eronate, care 
i-au derutat pe subiecţi). Itemii fără greşeli se introduc în partea a doua a 
- analizei de itemi, care aplică procedee specifice metodei alese pentru construirea 
testului (de exemplu, studiul validității itemilor sau calculul puterii de discrimi- 
nare a acestora). Este posibil să fie puşi în evidenţă alţi itemi necorespunzători. 
„Din itemii fara deficienţe se alcătuieşte un test, folosind un algoritm: specific 
metodei de construcţie alese la primul pas al algoritmului. 
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. Definirea testului 
Crearea băncii de itemi | : 
Constituirea unei 
variante a testului 
Administrarea testului 

Analiza rezultatelor testării 
suplimentară 
a testului 


Testul este corespunzător? pm 


Depistarea erorilor - Testul este 
corespunzător? 
DA 
Elaborarea 
normelor 
Elaborarea 


manualelor 
testului 


Eventual 
corectarea 
itemilor 


Verificarea 


Figura 12.1.1.1 
Algoritmul general de construire a unui test psihologic 


Se studiază caracteristicile acestui test (fidelitatea, validitatea, puterea 
de discriminare, dificultatea) şi, dacă sunt considerate acceptabile, se adminis- 
trează testul unui nou eşantion de persoane, similar primului, pentru a verifica 
dacă se păstrează calităţile. 

Atunci când pentru unul din eşantioane testul apare ca fiind inaccepta- 
bil, se alcătuieşte o nouă variantă a testului şi se reia procedura descrisă mai sus. 
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ent 


Dacă se menţin calităţile testului şi la verificarea suplimentară, se 
determină normele testului şi se stabilesc regulile de interpretare a scorurilor. 
După ce se redactează manualele, testul poate fi pus în circulaţie. 


12.1.2. Observaţii asupra metodelor de construire a testelor 


În majoritatea lucrărilor de teoria testelor psihologice, metodele de 
construire a testelor sunt împărţite în următoarele trei categorii (Burisch, 1986; 
Van Der Maesen, Hofstee, Whe 


A. Metodale deductive, denumite şi raţionale sau bazate pe simţul 
comun, sunt cele în care construirea itemilor şi selectarea celor care vor 
compune testul se bazează exclusiv pe părerile unor persoane (experţi sau nu). 
Mai întâi sunt alese constructele care vor fi măsurate de teste, apoi sunt elaborati 
itemii, care realizează o definire implicită sau explicită a constructelor, singurul 
ghid în această operaţie fiind intuiţia autorilor itemilor. Din această categorie fac 
parte: 

e metoda prototipului; 

e metoda BARS; 

e metoda designului cu fațete; 

e metoda intervalelor aparent egale. 


B. Metodele inductive sau interne pornesc de la o colecţie mare, 
eterogenă, de itemi (de obicei extraşi din teste aflate în circulaţie), considerată 
a fi reprezentativă pentru constructele care trebuiesc măsurate. Prin procedee 
statistice, cum sunt analiza factorială şi analiza de clusteri, se urmăreşte să se 
depisteze grupările de itemi care corespund constructelor respective. Din aceasta 
categorie de metode fac parte: 

e metoda consistentei interne; 

e metoda teoretică; 

e metoda analizei criteriului erh, 


C. Metodele externe sau empirice necesită precizarea, de la început, a 
relațiilor care vor trebui să existe între scorurile testului care va fi construit si 
diverse criterii externe. Se porneşte de la o colecție mare, eterogenă, de itemi, 
se compară scorurile acestora cu criteriile şi se retin cei care au comportarea pe 
care trebuie să o aibă întregul test. Din această categorie de metode fac parte: 

e metoda criteriului extern; | 

e metoda analizei constructului. 
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După cum se observă, metodele deductive nu necesită nici experi- 
mentarea itemilor, nici efectuarea unor analize statistice, în timp ce metodele 
inductive şi cele externe se bazează pe prelucrarea statistică a rezultatelor 
experimentării itemilor, acordând o pondere redusă modului de construire a 
itemilor. i 

În multe situații este posibilă - şi chiar recomandabilă - construirea 
testelor cu ajutorul mai multor metode: o metodă deductivă va servi la formarea 
băncii de itemi, iar printr-o metodă internă sau/şi una externă se vor selecta 
itemii care vor alcătui testul. 

Din acest motiv, în cadrul algoritmului de construire a testelor metodele 
deductive vor fi prezentate la pasul "Crearea băncii de itemi", iar metodele 
interne şi cele externe, la pasul "Analiza rezultatelor testului", 


12.2. DEFINIREA TESTULUI 


După ce se ia decizia de a construi un test, se precizează în detaliu: 

a. funcţia pe care o va îndeplini (măsurare sau predictie); 

b. populaţia căreia îi este destinat; | 

€. condiţiile în care va fi administrat: când, unde, cum, în cât timp; 

d. modul de interpretare a rezultatelor (prin raportare la obiective fixate 

a priori sau prin raportare la norme); 

e. motivele care au impus crearea lui. 

Aceste aspecte determină toate acţiunile legate de elaborarea şi 
experimentarea sa. | 

Pornind de la funcţia pe care o va realiza testul se decide care dintre 
caracteristicile sale psihometrice este mai importantă (fidelitatea sau validitatea), 
întrucât se ştie că un test nu poate avea în acelaşi timp şi o validitate relativă la 
criteriu foarte bună, şi o consistenţă internă ridicată. De asemenea, un test poate 
fi un instrument de măsură excelent, fără a avea vreo valoare predictivă. 

Modul de interpretare a rezultatelor unui subiect este dependent de 
scopul căruia îi va servi testul. Atunci când testul verifică dacă anumite 
deprinderi sau cunoştinţe ale unei persoane depăşesc un prag minim necesar, 
scorul individual va fi raportat la bareme fixate a priori. Dacă, însă, testul 
prezice comportamentul unei persoane în situaţii specifice sau determină cât de 
eficient este individul într-un anumit domeniu, comparativ cu alte persoane din 
populaţia căreia îi aparţine subiectul, atunci interpretarea scorului individual se 
face prin raportare la norme. a 

Tot la acest prim pas al algoritmului de construire a testului se decide: 

a. ce fel de scală de măsură va utiliza testul (nominală, ordinală sau de 

interval); 
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b. ce tipuri de itemi se vor include in test (in functie de ceea ce va 
măsura sau va prezice testul şi de faptul ca peut cotarea răspunsurilor 
se va utiliza sau nu calculatorul); 

c. cum vor fi ordonaţi itemii (după dificultate sau aleator); 

d. ce lungime va avea testul (în funcție de caracteristicile populației 
căreia i se va administra testul si de timpul de administrare); 

e. cum va fi administrat testul: cu sau fără limită de timp 


A. Atunci când noul test trebuie să măsoare un construct, este de dorit 
ca la baza sa să stea o teorie structurală asupra personalității, care să reflecte si 
importanța pentru viață a diferențelor individuale în privința acestuia 
(Angleitner, John, Löhr, 1986). Definirea constructului care va fi măsurat de test 
va specifica formele observabile relevante de manifestare a constructului 
respectiv (comportamente, interese, dorințe) şi, în plus, va prezenta relațiile care, 
conform teoriei, se aşteaptă să existe între acesta și alte constructe (atât relații ` 
convergente, cât şi discriminante). Astfel de relații se pot deduce uşor dacă 
pentru constructul măsurat de test se construieşte o rețea nomologica. 
Exemplu (Gregory, 1992). 

A.S. Kaufman şi N.L. Kaufman, când şi-au propus să construiască un 
„test pentru măsurarea inteligenţei, au formulat condiţiile impuse acestuia astfel: 
| e Să măsoare inteligenţa, având la bază o teorie puternică şi rezultate 
ale cercetărilor. 

e Să facă distincţie între cunosc dobândite şi abilitatea de a rezolva 
probleme cu care subiectul nu este familiarizat. 

e Să furnizeze scoruri care să poată fi utilizate pentru intervenţii 
educaţionale. 

e Să includă sarcini noi. 

e Să fie uşor de administrat. 

e Să fie cotat obiectiv. | 

e Să fie sensibil la diverse caracteristici ale preşcolarilor, ale grupurilor 
minoritare şi ale copiilor cu necesităţi speciale. | 


Ei 


B. Un test care urmează să fie folosit în selecţia profesională trebuie să 
poată prezice corect performanţa persoanelor într-o anumită muncă. Pentru 
asemenea teste este necesar să se realizeze, de la început: 

a. analiza muncii respective: să se obţină informaţii despre sarcinile de 
muncă şi despre cerinţele postului; 

b. descrierea muncii: să se prezinte în detaliu, pentru munca respectiva, 
sarcinile, responsabilitatile si conditiile de lucru; 
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c. specificarea muncii: să se stabilească ce caracteristici fizice şi psihice 
sunt necesare desfăşurării muncii respective, alături de care se vor evidenția 
(Kline, 1993): rie 

© deprinderile şi cunoştinţele care nu sunt absolut necesare, desi simtul 
comun ar sugera ca ele sunt importante pentru indeplinirea muncii (de 
exemplu, cunostintele de anatomie nu le sunt absolut necesare 
psihiatrilor, ele intervenind extrem de rar in activitatea lor zilnică): 
e caracteristicile necesare datorită contextului în care se desfăşoară 
munca respectivă. (De exemplu, un flautist profesionist trebuie să fie 
capabil să lucreze într-o orchestră mare, să fie familiarizat cu repertoriul 
ultimelor trei secole, să poată să cânte în concerte după un număr mic 
de repetiţii, să poată suporta efortul unor călătorii lungi şi să fie dispus 
să lipsească mult de acasă. Aceste cerinţe sunt diferite de cele pentru un 
flautist de jazz sau pentru un flautist într-o formaţie muzicală mică.) 


C. În cazul testelor de cunoştinţe, definirea testului constă în descrierea 
domeniului de conţinut. Adesea, se construieşte o tabelă de specificaţii, care 
indică repartiţia itemilor testului în funcţie de obiectivele comportamentale 
urmărite de test şi de temele a căror cunoaştere se verifică. O asemenea tabelă 
este prezentată în tabelul 12.2.1, | 

Tabela de specificaţii serveşte ca bază pentru a decide ce fel de itemi se 
vor introduce în test, întrucât pentru fiecare celulă a tabelului sunt mai potrivite 


. 
. 


anumite tipuri de itemi (de exemplu, capacitatea de explicare a unor fapte poate 
fi verificată mai bine prin itemi de tip eseu decât prin itemi cu răspunsuri 
închise). 

Apariţia unui test nou trebuie să răspundă unei necesităţi reale. Se 
recurge la procedura - costisitoare - de creare a unui test atunci când nu există 
un test care să îndeplinească scopul urmărit (măsurarea unui anumit construct, 
verificarea cunoştinţelor dintr-un anumit domeniu sau predicția unui anumit 
comportament), dacă testele disponibile sunt dificil de administrat, de cotat 
sau/şi de interpretat ori sunt prea scumpe. Uneori se construiesc forme paralele 
ale unor teste existente, fie pentru a nu administra repetat acelaşi test, fie pentru 
a se evita transmiterea itemilor de la un eşantion de subiecţi la altul şi a putea 
păstra secret conţinutul testului (de exemplu, în cazul testelor de cunoştinţe 
utilizate la diverse concursuri). 
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Tabelul 12.2.1 
" Tabela de specificaţii pentru verificarea cunoştinţelor la tema 
"Teoria testelor psihologice” 


Validitatea Fidelitatea testelor Analiza de itemi 
testelor i 


Obiectivul 
comportamental 


Dificultatea unui ` 
item. 


Validitatea relativă 
la: 


Consistenţa internă. 
Stabilitatea în timp. 


Cunoaşterea 
terminologiei 


-construct; Forme paralele ale Validitatea unui 
-continut; testelor. item. 
-criteriu. (2 itemi) 


(3 itemi) 


Cunoasterea Metoda de studierea | Metodele: Procedura de 
faptelor validității: -test-retest; calcul pentru: 
specifice -predictive; -formelor paralele; -indicele de 
-concurente. -analiza consistenţei dificultate; 
(2 itemi) interne. -puterea de 
(3 itemi) discriminare; 
_ -coeficientul de 


validitate. 


Înţelegere Explicarea legăturii Explicarea utilizării Explicarea 
dintre validitate şi coeficientului de deosebirii dintre 
fidelitate. Explicarea | fidelitate pentru puterea de 
efectelor restrângerii | interpretarea discriminare şi 
intervalului de valori | scorurilor la test. validitatea 
asupra coeficientului | (1 item) itemilor. 
de validitate. (1 item) 


Aplicarea formulei lui - 


Aplicare Calculul unui Calului indicelui 
coeficient de Spearman-Brown. ` de dificultate şi 
validitate. Determinarea al puterii de 
(1 item) numărului de itemi discriminare. 

care trebuiesc (2 itemi) 


adăugaţi unui test 
pentru dublarea 
valorii coeficientului 
de fidelitate. 

2 itemi i 


onemi | simi 


9 itemi 


12.3. CREAREA BANCI DE ITEMI 


Itemii care se introduc în banca de itemi pot să provină din mai multe 
surse: 

a. sunt formulati de psihologi, pe baza unei teorii (dacă testul măsoară 
un construct psihologic); 

b. sunt elaborati de specialişti din domeniul în care va fi: aplicat testul 
(dacă acesta evaluează deprinderi ori cunoştinţe însuşite în urma unui program 
de instruire sau dacă se utilizează în selecţia profesională); 

c. sunt creaţi de diverse persoane (nu neapărat experţi), ca ilustrări ale 
comportamentelor pe care acestea le consideră caracteristice unui anumit 
construct; 

d. sunt extraşi din teste existente, care au fost administrate unui lot de 
persoane asemănător celui căruia îi este destinat noul test. 

Ultimul procedeu se aplică de obicei atunci când s-a constatat că itemii 
respectivi conţin un factor comun care corespunde constructului pe care îl va 
măsura testul sau când aceştia îndeplinesc cerinţele care decurg din scopul în 
care va fi utilizat testul. De exemplu: 

e au cu alte variabile legături conforme teoriei care stă la baza 

constructului 


sau. 
e se încadrează în domeniul de conţinut al testului 
sau "PI | 
e corelează semnificativ cu variabila criteriu 
sau | 


e discriminează între două grupe contrastante de persoane. 


Înainte de introducerea itemilor în bancă se stabileşte modul în care vor 
fi cotati. Uneori, se apreciază dificultatea acestora, atunci când ea este importan- 
tă pentru alegerea cotelor care vor fi acordate răspunsurilor sau dacă în testul 
care va fi format itemii vor fi aranjaţi în ordinea crescătoare a difi icultăţii. 

Se recomandă ca numărul itemilor introduşi în bancă să fie cel puţin cu 
20% mai mare decât lungimea testului (Aiken, 1994). 

După ce itemii au fost scrişi, este bine ca ei să fie revazuti şi editati de 
o persoană care nu a participat la elaborarea lor. Ea poate sesiza eventualele 
erori şi poate face propuneri pentru îmbunătăţirea itemilor. 

Există firme specializate în crearea de teste, cum este, de exemplu, 
Educational Testing Service. Acestea folosesc pentru scrierea itemilor persoane 
care au cunoştinte din domeniul la care se va referi testul şi, în plus, au 
deprinderea de a crea itemi. 
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Cei care doresc sa elaboreze itemi de test pot utiliza drept model itemii 
din testele standardizate SOUS als 


Prezentam în continuare câteva metode de creare a băncii de itemi, din 
cadrul metodelor deductive de construire a testelor. În cazul metodelor interne 
şi externe de construire a testelor, alcătuirea: băncii de itemi este mai simplă: 
itemii -noi sau extraşi din alte teste- nu mai sunt verificaţi înainte de a fi 
introduşi în bancă, întrucât după administrarea lor unui eşantion de subiecţi 
rezultatele obţinute vor fi prelucrate statistic. 

a 

Metoda prototipului (Oosterveld, Vorst, 1995) se utilizează pentru 
construirea chestionarelor de personalitate. 

Mai întâi sunt generati itemii. In acest scop, persoanelor care participă 
‘la această acţiune li se cere să descrie comportamente tipice pentru indivizi care 
au valori foarte mari la constructul măsurat de test. De exemplu, pentru * 
elaborarea unui test care să evalueze dominanta, se poate folosi instrucţiunea; 
"Gândiţi-vă la trei bărbaţi (femei) care sunt cei mai dominanti dintre 
cunoştinţele dumneavoastră. Descrieţi cinci acţiuni sau comportamente ale 
acestora prin care puteţi exemplifica de ce îi consideraţi dominanti." 

Se analizează apoi mulţimea de descrieri obţinute, se elimină 
redundantele şi se corectează greşelile de exprimare. Fiecare descriere rămasă . 
va constitui un item. 
| Pasul următor constă din evaluarea itemilor de către mai multe 
persoane. Se acordă fiecărui item câte o cotă, de exemplu între 1 şi 5, care să 
reflecte cât de tipic este comportamentul descris de item one cei care au 
valori mari la constructul măsurat de test. 

Se calculează pentru fiecare item media teid primite de la toți 
evaluatorii si se retin în banca itemii care au mediile cele mai mari.. 


O variantă a acestei metode (Angleitner, John, Lohr, 1986) porneşte de 
la definirea mai multor constructe, pe baza unui model structural al 
comportamentului interpersonal. Un grup numeros de subiecţi elaborează, 
‘pentru fiecare construct, itemi care descriu manifestări comportamentale 
specifice constructului. Apoi, fiecare item este analizat de persoane dintr-un alt 
grup şi este atribuit constructului pe care se consideră că îl ilustrează cel mai 
bine. Sunt reţinuţi în banca de itemi doar acei itemi care au fost alocati, cu 
frecvenţă mare, constructului pentru ilustratea căruia au fost creaţi. 


Metoda BARS (Behaviorall Anchored Rating Scales) a fost aplicată 
la început pentru construirea unor scale de apreciere a comportamentului legat 
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de munca. Fiecare scala corespundea unei dimensiuni a activităţii profesionale, 
iar ancorele erau exemple de niveluri de performanţă. Mai nou, această metodă 
este utilizată şi pentru elaborarea unor chestionare de autoevaluare comporta- 
mentală bazate pe ancore. Este cazul unor chestionare care măsoară constructe 
multidimensionale. În cadrul lor, fiecare scală se referă la câte o dimensiune. 

Algoritmul de construire a unui asemenea chestionar este compus din 
următorii paşi (Landy, Rastegary ş.a., 1991): , 

(1) Un grup de specialişti în domeniul pentru care se construieşte 
chestionarul încearcă să identifice dimensiunile constructului. Fiecare 
dimensiune primeşte un-nume, fără a fi, însă, definită. 

(2) Lista cu denumiri este revăzută. Se elimină redundantele. Unele 
denumiri sunt combinate între ele şi reformulate, pentru a se obține categorii 
mai uşor de înţeles. 

(3) Pentru fiecare "etichetă" a constructului se generează o definiţie. Se 
contopesc dimensiunile pentru care, în urma analizei definiţiilor, se constată 
existenţa unor suprapuneri. | 

(4) Se generează exemple pentru diverse niveluri de manifestare a 
dimensiunilor. De pildă, se pot fixa trei niveluri (înalt, mediu şi scăzut) şi i se 
cere fiecărei persoane din grupul de specialişti să formuleze câte trei ancore 
pentru fiecare nivel al fiecărei dimensiuni. 

(5) Se elimină exemplele duble. 

(6) Toate ancorele rămase sunt prezentate unui grup de evaluatori care 
au sarcina de a identifica dimensiunea la care se referă fiecare. Sunt reţinute 
exemplele pentru care cel puţin 75% dintre persoane au recunoscut dimensiunea 
măsurată. i Í 
(7) Se elimină dimensiunile cărora li s-au repartizat doar puține ancore. 

(8) Un alt grup de persoane atribuie valori dintr-o multime fixata (de 
exemplu, (1,2,...,7)) fiecărei ancore. Ponderea acordată trebuie să reflecte 
nivelul de dezvoltare ‘al constructului măsurat de chestionar pentru care 
exemplul respectiv este potrivit. 

(9) Pentru fiecare ancoră se calculează media şi abaterea standard a 
cotelor primite. Se elimină exemplele care au abateri standard mari (de obicei, 
cele pentru care 0>1); acestea au fost interpretate diferit de către evaluatori. 

(10) Se ordonează ancorele fiecărei dimensiuni crescător după medie. 
Se formează scalele -câte una pentru fiecare dimensiune-reţinând între 4 şi 8 
ancore, repartizate între nivelul cel mai scăzut şi nivelul cel mai ridicat de 
manifestare a dimensiunii respective. | 


Asemănătoare cu metoda BARS este metoda ordonării comporta- 
mentelor de către experţi (Gregory, 1992). Aceasta serveşte la crearea unor 
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teste în care itemii sunt aşezaţi in ordinea crescătoare a dificultatii si care au 
proprietatea că ori de câte ori un item este potrivit pentru o persoană, sunt 
potriviti într-o oarecare măsură şi toţi itemii care îl preced. Scorul unui subiect 
este dat de numărul de ordine al celui mai dificil item care i se potriveşte. 
Un exemplu de astfel de test îl reprezintă "Scala celui mai bun răspuns 
verbal" din Glasgow Coma Scale for Recording Depth of Coma, un test utilizat 
în spitale pentru evaluarea gradului de afectare a creierului în urma unui 
traumatism, Itemii componenți sunt: 
l - nici un răspuns; 
2 - răspuns care nu poate fi înţeles; 
3 - răspuns nepotrivit; 
4 - răspuns confuz; 
5 - răspuns la obiect. 
Scorul scalei este stabilit de medic în urma observării pacientului. 


Metoda designului cu fațete (Oosterveld, Vorst, 1995) are ca punct de 
pornire analiza constructului pe care îl va măsura testul şi deducerea aspectelor 
mai importante ale acestuia, denumite "fațete". De exempli fatetele pot fi 

"situația" şi "răspunsul". 

Pentru fiecare fateta se identifica elenientele cele mai importante. Fateta 

ASRUS de pildă, poate avea ca elemente: "cognitiv", "psihologic", 
"comportamental" şi "afectiv". 

Se construieşte apoi o matrice, cu atâtea E an câte fațete au fost 
alese, in care fiecare celulă corespunde unui element din fiecare faţetă. De 
exemplu, o celulă poate corespunde răspunsului "cognitiv" şi situaţiei 
"îmbolnăvire gravă”. Această matrice este denumită "designul cu fațete". 

Se scriu unul sau mai mulţi itemi pentru fiecare celulă a matricii. 


Metoda intervalelor aparent egale (Gregory, 1992; Kline, 1993) a 
fost propusă de L.L Thurstone pentru construirea scalelor de evaluare a 
atitudinilor. 

Se începe cu formarea unei colecţii, cât mai bogate, de itemi dihotomici, 
care se referă, toţi, la atitudinea faţă de un acelaşi obiect (persoană, instituţie, 
situaţie sau noţiune abstractă). La fiecare item se poate răspunde doar prin 
"adevărat" sau "fals". Răspunsul ales de subiect este privit ca o reflectare a 
atitudinii sale, pozitive sau negative. De exemplu, pentru cercetarea atitudinii 
faţă de filmele muzicale se pot folosi itemii: "Un film muzical mă face 
optimist." şi "Este o pierdere de vreme să urmăresc un film muzical”. 

Un grup de experţi analizează fiecare item şi apreciază cât de favorabilă 
este atitudinea studiată la persoanele care răspund cu "adevărat", acordând o 
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cotă cuprinsă între 1 (extrem de nefavorabilă) şi 11 (extrem de favorabilă). 
Evaluatorilor li se cere să privească cele 11 cote posibile ca fiind echidistante. 

Pentru fiecare item se calculează media şi dispersia cotelor primite. 
Deoarece o dispersie mare indică o neconcordanţă a părerilor, itemii cu dispersii 
mari sunt eliminaţi. Media cotelor va fi considerată drept scor corespunzător 
răspunsului "adevărat". i 

Fiecărei persoane examinate cu un astfel de test i se cere să indice itemii 
la care răspunsul său este "adevărat". Scorul total al testului pentru un subiect 
va fi egal cu media scorurilor itemilor indicaţi. 

Scalele de acest tip se compun din 20-30 de itemi, aleşi astfel încât 
scorurile corespunzătoare răspunsului "adevărat" să fie aproximativ echidistante 
în intervalul [1, 11]. 

O metodă asemănătoare celei descrise mai sus utilizează mediana în 
locul mediei, atât pentru determinarea scorurilor itemilor, cât şi pentru calculul 
scorului unui subiect. | | 


12.4. CONSTRUIREA UNEI VARIANTE A TESTULUI 


Înainte de selectarea itemilor din banca de itemi, pentru alcătuirea unei 
variante a testului, se stabileşte lungimea acestuia. Numărul de itemi care îl vor 
compune are influenţă atât asupra timpului de rezolvare a testului, cât şi asupra 
calităţilor sale psihometrice (fidelitate, putere de discriminare). 

Lungimea testului este aleasă în funcţie de timpul disponibil pentru 
administrarea testului, care este fixat, in general, ţinând cont de condiţiile în care ` 
va fi utilizat testul (într-o oră de clasă, la un concurs de admitere într-o instituţie 
de învăţământ etc.). | ] 

Timpul de rezolvare a unui test este dependent nu numai de numărul 
itemilor componenți, ci si de: 

e vârsta subiecţilor; 

e deprinderea subiecţilor de a citi; 

e lungimea şi dificultatea itemilor; 

e modul de formulare a răspunsurilor şi lungimea acestora. 

În practică s-a constatat că un test de dificultate medie, administrat 
elevilor din gimnaziu, necesită cam un minut pentru rezolvarea unui item cu 
alegere multiplă sau cu răspuns lacunar şi aproximativ 30 de secunde pentru 
alegerea răspunsului la un item dihotomic. Prin urmare, într-o oră de clasă de 
50 de minute se pot administra teste compuse din 100 de itemi dihotomici sau 
50 de itemi cu alegere multipla ori cu raspuns lacunar. In acelasi interval de 
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timp se ak bka 5-6 itemi cu răspunsuri deschise, care necesită, pentru 
fiecare răspuns, cam jumătate de pagină (Aiken, 1994). 

În orice caz, o testare nu are voie să depăşească o oră pentru elevii din 
şcoala primară si o oră si jumătate pentru cei din gimnaziu si din liceu. Întrucât 
copiii preşcolari şi elevii din clasele primare nu pot să rămână atenți la sarcinile 
testului mai mult de 30 de minute, dacă rezolvarea testului necesită un timp mai 
lung, se va recurge la administrarea testului în mai multe sesiuni de lucru 
(Aiken, 1994). 
| o se extrag aleator itemii mu bancă 
sau i 

e dacă a fost întocmită o vel de specificatii, se respecta frecventele 

înscrise în fiecare celulă a sa — 
sau i 

e dacă dificultatea itemilor a fost apreciată înainte de introducerea lor 

în banca de itemi, se aleg itemii astfel încât valorile dificultăților lor să 

fie repartizate cât mai uniform pe intervalul valorilor posibile sau dorite 

(uneori se urmăreşte alcătuirea unui test dificil sau a unuia uşor). 
Atunci când testul format conţine itemi de mai multe tipuri, este recomandabil 
ca toţi itemii de acelaşi tip să fie grupaţi, pentru ca subiectul să nu mai facă si 
efortul de a identifica, la fiecare item, modul în care trebuie să răspundă. Acest 
procedeu facilitează, de asemenea, administrarea şi cotarea testului. | 

Aranjarea itemilor în ordinea crescătoare a dificultății îi ajută pe unuii 
subiecţi, crescându-le motivaţia pentru rezolvarea testului: văzând că pot rezolva 
primii itemi, ei vor anticipa obţinerea succesului în continuare şi vor avea 
curajul de a aborda şi itemii mai dificili. La testele administrate cu limită de 
timp şi 'la cele foarte dificile, acest mod de aranjare are ca efect creşterea 
scorurilor testului. Dar, se pare că efectul său este scăzut sau nul în cazul 
itemilor cu alegere multiplă. | 

Se va decide apoi cum vor fi aranjaţi itemii în pagină, pentru a putea fi 
uşor de citit, dar şi pentru a permite utilizarea economică a hârtiei. În funcţie de 
locul unde vor fi marcate răspunsurile (pe broşura testului sau pe foaia de 
răspuns) se va stabili aşezarea în pagină a poziţiilor care vor conţine 
răspunsurile, astfel încât corectarea să se facă uşor, eventual cu ajutorul unui 
şablon sau al calculatorului. 

După alcătuirea testului, se vor redacta instrucţiunile de administrare. 
Acestea trebuie să fie clare şi să furnizeze suficiente detalii, pentru a nu fi 
necesare comentarii suplimentare în momentul testării. 

Instructiunile de lucru vor conține informații privind scopul testării, 
modul de lucru, din câți itemi se compune testul, cât timp este alocat pentru răs- 
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puns şi cum se cotează răspunsurile. De asemenea, se va menţiona dacă este sau 
nu recomandabil să se ghicească răspunsul, atunci când nu se cunoaşte răspun- 
sul corect sau cel mai potrivit, şi dacă este sau nu permis să se omită răspunsul. 

Autorul testului are sarcina de a utiliza cele mai potrivite elemente 
grafice (sublinieri, caractere mai mari, culori contrastante) pentru a atrage 
atenţia asupra anumitor părţi din instrucţiunile de administrare, aşa încât cei care 
le vor citi subiecţilor să ştie cum să îşi modifice intonatia. 


12.5. ADMINISTRAREA TESTULUI 


Administrarea testului se va face in aceleasi condiţii în care va fi utilizat 
în practică. Se obişnuieşte ca broşura testului şi foaia de răspuns să le fie 
înmânate subiecţilor doar după citirea instrucţiunilor de administrare a testului 
şi rezolvarea eventualelor nelămuriri. Mai întâi se dă foaia de răspuns şi se 
repetă instrucţiunile privind modul de completare a răspunsurilor. Apoi, fiecare 
subiect va primi broşura testului, aşezată cu fata în jos. Ea va fi întoarsă doar la 
comandă, de toate persoanele în acelaşi timp. 

Este foarte important să li se spună subiecţilor ce informaţii de 
identificare trebuie să completeze (nume, sex, vârstă, funcţie etc.) şi unde. 

În general (nu nuniai în faza de construire a testului), dacă testele se 
administrează în clasă, elevii trebuie să fie informaţi din timp când şi unde se 
va face testarea, ce fel de test se va administra (oral, scris etc.) şi la ce se referă 
acesta, pentru a se putea pregăti intelectual, emoţional şi fizic. 


12.6. ANALIZA REZULTATELOR TESTÂRII 


Se face o analiză atentă a modului în care a decurs testarea, urmărindu- 
se dacă instrucţiunile de administrare au fost complete şi dacă timpul de lucru 
a fost suficient. Se prelucrează apoi răspunsurile primite de la subiecţi şi se 
încercă să se construiască un test, pe baza celui experimentat. Se procedează 
astfel: | 

(1) Se face analiza de itemi. 

(2) Se elimină itemii necorespunzători. | 

(3) Eventual, dintre itemii rămaşi se selectează cei care satisfac anumite 

condiţii, prin care se asigură o valoare cât mai bună a unui anumit 

parametru al testului. 
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(4) Se analizează apoi caracteristicile psihometrice (fidelitatea, 
validitatea, dificultatea, puterea de discriminare) ale testului obținut. 


12.6.1. Analiza de itemi 


Analiza de itemi are ca obiective esenţiale descifrarea mecanismelor 
cognitive aplicate de subiecţi pentru formularea răspunsurilor la itemi şi 
verificarea calităţilor itemilor ca instrumente de măsură sau de predictie. Ea 
furnizează informaţiile pe baza cărora se selectează itemii care vor intra în 
componenţa testului. 

Este important de înţeles rolul suplimentar al analizei de itemi în cazul 
testelor care măsoară constructe. Dacă la început se dispune de o descriere, mai 
mult sau mai puţin detaliată a constructului, care serveşte ca bază pentru scrierea 
itemilor, după analizarea itemilor se fac inferente asupra constructului pornind 
de la relaţiile constatate între răspunsurile la itemi. Deci, deşi construirea testului 
începe cu definirea teoretică a constructului, constructul ajunge să fie o inferenta 
fundamentată pe consistenţa răspunsurilor la itemi (Steinberg, Thissen, 1996). 

Alegerea procedurilor statistice aplicate în cadrul analizei de itemi şi 
interpretarea rezultatelor obţinute sunt determinate de tipul itemilor, de funcţia 
pe care o va îndeplini testul şi de calităţile ephametrice pe care trebuie să le 
aiba acesta. 

Pentru fiecare item, se efectuează una sau mai multe dintre următoarele 
prelucrări: 

a. calculul iti cu care au fost alese erorile şi identificarea 

cauzelor care au determinat frecvenţe foarte mari sau foarte mici; 

b. inspectarea textului itemului pentru depistarea termenilor ambigui, 

a absenței unor informaţii necesare pentru formularea unui răspuns 

corect şi identificarea răspunsurilor propuse neplauzibile (pe care nu le 

alege nimeni) sau evidente (pe care le aleg toţi cei testati); 
c. verificarea comportării itemului fata de diverse criterii; 

îi determinarea capacităţii itemului de a face deosebire între examinaţii 

care au nivel scăzut şi cei care au nivel ridicat la variabila măsurată sau 

prezisă de test. 


Vom descrie în continuare procedeele statistice ale analizei de itemi. 
Pentru simplificarea expunerii, vom desemna prin expresia "rezolvare 
corectă/greşită a itemului" indicarea de către subiect a acelui răspuns care 
corespunde nivelului înalt/scăzut al variabilei măsurate sau prezise de test. 
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12.6.1.1. Indicele de dificultate al unui item 


Cea mai obişnuită măsură a dificultatii itemului este frecventa relativa 
a persoanelor care au rezolvat corect itemul, din totalul celor cărora li s-a 
administrat testul (Murphy, Davidshofer, 1987). 

Indicele de dificultate astfel definit se notează cu P şi reprezintă scorul 
mediu care s-ar obţine la item dacă s-ar acorda un punct pentru răspunsul corect 
şi zero puncte în cazul răspunsului greşit sau omis. Se observă că p este cuprins 
întotdeauna între 0 şi 1. l 

Davis (1955) recomandă ca, atunci când testul este administrat cu limită 
de timp şi există persoane care nu au reuşit să îl parcurgă integral, la calculul 
frecvenţei relative p pentru un anumit item să se utilizeze drept numitor numărul 
examinatilor care au citit întrebarea şi nu efectivul lotului căruia i s-a 
administrat testul. Pentru fiecare persoană vor fi considerate necitite toate 
întrebările aflate după ultimul item rezolvat. 

Indicele de dificultate este o caracteristică atât a itemului, cât şi a 
populaţiei căreia i s-a administrat testul. Un item cu răspunsuri la alegere care 
cere rezolvarea unei ecuaţii de gradul al doilea va fi rezolvat corect de 
majoritatea elevilor din clasa a X-a, în timp ce elevii din clasa a III-a vor omite 
răspunsul sau vor alege unul greşit, deci indicele său de dificultate va fi diferit 
de la o populaţie la alta. 

Valorile extreme ale lui p restrâng variabilitatea scorurilor la test. Itemii 
cu p=0 (care nu au fost rezolvati corect de nici o persoană) şi cei cu p=1 (care 
au fost rezolvati corect de toti cei examinati) nu contribuie la măsurarea 
variabilei vizate de test şi, prin urmare, sunt inutili. 

Dispersia scorurilor la un test format din itemi necorelati liniar între ei 
este maximă atunci când toţi itemii au indicele de dificultate egal cu 0.5. 

În general, itemii al căror indice de dificultate ia valori în intervalul 
[0.3, 0.7] permit o diferenţiere bună între subiecţi (Gregory, 1992). 

Pentru itemii dihotomici şi pentru cei cu alegere multiplă care au un 
singur răspuns corect se recomandă să se păstreze în test itemii al căror indice 
de dificultate este apropiat de valoarea 0.5+g/2, unde g reprezintă probabilitatea 
de a ghici răspunsul corect, adică este egal cu raportul 1/ numărul de răspunsuri 
posibile (Gregory, 1992). 

Atunci când testul va fi utilizat pentru selecţia persoanelor care vor face 
parte dintr-un grup extrem (cu valori foarte mari sau foarte mici ale 
caracteristicii măsurate de test), se va forma testul din itemi care au indicele de 

dificultate mai mic decât 0.3 sau mai mare decât 0.7. | 
| Pentru întrebările cu alegere multiplă din testele de aptitudini sau de 
cunoştinţe, care pretind selectarea unui singur răspuns, dacă se acceptă 
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presupunerea că examinatii care nu cunosc răspunsul corect aleg la întâmplare 
„dintre cele n răspunsuri propuse, se poate calcula indicele de dificultate cu 
următoarea formulă: 


026.111) 


unde | 
p este frecvenţa relativă a persoanelor care au răspuns corect la item. 
P- reprezintă scorul mediu care s-ar obţine la item dacă s-ar acorda un 
punct pentru răspunsul corect şi -1/(n-1) puncte pentru răspunsurile greşite sau 
omise. i | 

Guilford (1965) propune să se utilizeze aceasta formulă atunci când 
trebuie să se compare, în ceea ce priveşte dificultatea, itemi care au numere 
diferite de răspunsuri propuse. Intuitiv, dacă doi itemi se referă la acelaşi lucru, ` 
sunt bine formulati, aşa încât răspunsurile propuse sunt la fel de atractive pentru 
cei care nu cunosc răspunsul corect, dar unul propune n, răspunsuri, iar celălalt 
n răspunsuri, n;<n, ar fi de aşteptat ca primul item să fie rezolvat corect de mai 
mulţi subiecţi decât al doilea. Dacă, totuşi, frecvenţa relativă a rezolvărilor 
corecte este aceeaşi pentru ambii itemi, înseamnă că primul item este mai dificil. 
Acest lucru este pus în evidenţă de Sie Pe. după cum rezultă din 
inegalitatea: 


np-l ee 
< i 5 
Tae, Pih, PON (12.6.1.1.2) 


a 


Indicii de dificultate definiti până acum nu sunt potriviţi în cazul 
- întrebărilor care cer mai multe răspunsuri, întrucât nu iau în considerare decât 
trei situaţii: item rezolvat integral corect, item greşit şi item omis. Rezolvările 
parţial corecte sunt considerate greşite, indiferent câte răspunsuri corecte s-au 
dat din cele k cerute. Pentru a evita acest inconvenient şi a putea compara 
asemenea itemi, se utilizează următoarea formulă de calcul al indicelui de 
dificultate: 


k 
Div; | | (12.6.1.1.3) 


unde: 
p; = frecvenţa relativă a celor care au dat i răspunsuri corecte. 
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Pm reprezintă scorul mediu al itemului dacă s-ar acorda 1/k puncte 
pentru fiecare răspuns corect ales. 

Pentru 4=1, Pm coincide cu p, frecvenţa relativă a celor care au rezolvat 
corect itemul. 

Pm astfel definit variază între 0 (când nu a fost indicat nici măcar un 
răspuns corect) şi 1 (când toate persoanele au indicat cele k răspunsuri corecte). 
Pm are valoare mare atunci când frecvenţa relativă a celor care au dat toate 
răspunsurile corecte este mare. 

În cazul itemilor cu alegere multiplă este bine să se calculeze şi 
frecvenţa relativă cu care a fost ales fiecare răspuns propus, pentru a identifica 
răspunsurile corecte care au fost alese de foarte puţini subiecţi şi răspunsurile 
greşite alese de multe persoane. | 

Există situaţii, cum este cazul scalelor Likert, în care itemul pretinde 
alegerea unui singur răspuns, dar răspunsurile propuse nu sunt dihotomizate în 
"corect"/ "greşit" sau "adevarat"/ "fals", ci fiecare răspuns primeşte un alt 
punctaj. Atunci, în locul indicelui de dificultate al itemului se vor calcula scorul 
mediu şi abaterea standard a scorurilor itemului. În mod obligatoriu se va 
„analiza şi forma repartitiei scorurilor itemului, pentru a depista cazurile când 
sunt alese cu frecvenţe mari două sau mai multe răspunsuri care ar trebui să 
exprime lucruri foarte deosebite între ele şi a determina cauza. 

O imagine mai clară asupra modului în care persoanele examinate au 
rezolvat itemul o oferă energia informaţională a itemului, calculată cu formula 
(Cresin, 1966): | 


yea- 
pg = HtAtro) k (12.6.1.1.4) 
l 
` i k 
unde: 
Pi = frecvența relativă a celor care au ales răspunsul i, i=1,2,...,k. 
o > = frecvenţa relativă a celor care nu au răspuns la item. 


Energia informațională variază între 0 (când toate persoanele au răspuns 
la item gi toate frecvențele relative p; sunt egale) si 1 (când toate persoanele au 
ales acelaşi răspuns). Ea este mică atunci când toate răspunsurile propuse au fost 
alese cu frecvențe apropiate si este mare atunci când persoanele au ales un 
număr mic de răspunsuri. * 
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12.6.1.2. Analiza raspunsurilor incorecte 


La o întrebare cu răspunsuri la alegere dintr-un test de aptitudini sau de 
cunoştinţe este important să se verifice dacă factorii de distragere (răspunsurile 
incorecte din lista de răspunsuri propuse) îşi îndeplinesc într-adevăr misiunea. 

Un procedeu de lucru recomandat în cazul întrebărilor care cer 
selectarea unui singur răspuns din n răspunsuri propuse este următorul (de 
Landsheere, 1975; Murphy, Davidshofer, 1987): 

a. Pentiu fiecare răspuns greşit i, se calculează: 

o frecvenţa observată, Jo» egală cu an relativă a cazurilor în care 
a fost ales: 


N: ; 
Joi = W l (12764246) 
şi - l 
e frecvența teoretică, f, egală cu frecvența relativă a cazurilor în care 
ar fi fost ales dacă toți cei care au dat un răspuns aye ar fi ales 
răspunsul greşit la întâmplare: ! 
Fade: 12.6.1.2.2 
1 Mn-1) Vian a 
unde: 


N = numărul de subiecţi care au răspuns la item; 
Nc = numărul de subiecţi care au ales răspunsul corect; 
N, = numărul de subiecţi care au ales răspunsul i. 
Toate răspunsurile greşite ale itemului au aceeaşi frecvenţă teoretică. 
b. Se apreciază că întrebarea este bine construită dacă pentru fiecare 
răspuns greşit frecvenţa observată Joi este aproximativ egală cu frecvenţa 
„teoretică f. 


Exemplu 


Tabelul următor prezintă Ireoventdi de răspuns la un item care propune 4 
răspunsuri: 
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Frecvența alegerii Frecventa 

fiecărui răspuns observată 

Răspuns a fiecărui 
răspuns 


l 
2 
corect 3 
4 


Frecvența teoretică a fiecărui răspuns greşit este egală cu 


_ 200-108 
J -200+3 


= 0.153 


Raspunsul gresit 4 are frecventa observata apropiată de frecvenţa 
teoretică. În schimb, răspunsurile 1 şi 2 au fost alese de mult mai mulți, 
respectiv mult mai puţini subiecţi decât era de aşteptat, dacă s-ar fi ghicit 
răspunsul. Ar trebui analizate răspunsurile greşite pentru a se depista cauzele 
abaterilor frecvenţelor observate de la frecvenţa teoretică. | 

Se consideră că un răspuns greşit pe care nu îl aleg decât foarte puţine 
persoane nu îşi îndeplineşte rolul de factor de distragere întrucât este identificat 
cu uşurinţă drept greşit şi, în acest fel, scade dificultatea sarcinii subiectului, 
care nu mai are de ales răspunsul corect dintre cele n răspunsuri propuse, ci 
dintre n-1, Un asemenea răspuns trebuie înlocuit. 

Un răspuns greşit ales de un număr mare de persoane poate conţine o 
formulare incoreéta sau incompletă, care îl face să semene cu răspunsul corect, 
dar, în acelaşi timp, poate semnala existenţa unei erori la răspunsul corect, care 
îi determină pe subiecţi să îl respingă şi să aleagă unul dintre celelalte 
răspunsuri. j 

Există şi situații în care unele răspunsuri greşite sunt formulate 
intenţionat astfel încât să se deosebească de răspunsul corect doar prin câte un 
element subtil. Ele vor fi alese frecvent, dar întrebările de acest tip sunt utile 
pentru a-i identifica pe subiecţii cu un nivel înalt al variabilei măsurate de test 
(de exemplu pentru selecţia elevilor în lotul Olimpic). 

La baza algoritmului descris mai sus a stat următorul raţionament: 
Subiectii cărora li se prezintă o întrebare cu alegere multiplă se împart în două 
categorii; unii cunosc răspunsul corect şi îl marchează, ceilalţi aleg la întâmplare 
din lista de răspunsuri propuse. În realitate, însă, modul de selecţie a răspunsului 
diferă de la un subiect la altul. Unele persoane aleg un răspuns eronat cu 
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convingerea că acesta este cel corect. Alţii sunt capabili să identifice unul sau 
mai multe răspunsuri. greşite şi să le elimine, alegând la întâmplare dintre 
celelalte. În sfârşit, mai sunt şi persoane care aleg răspunsul bazându-se pe alte 
considerente, cum ar fi lungimea răspunsurilor propuse, precizia limbajului 
folosit în formularea acestora, poziţia răspunsului corect în întrebările pe care 
le-a parcurs deja etc. Din aceste motive, în multe cazuri răspunsurile greşite 
sunt alese cu frecvenţe diferite unele de altele. | 
Pornind de la ideile teoriei răspunsului la itemi, Murphy şi Davidshofer 
(1987) recomandă construirea funcţiei caracteristice a fiecărui răspuns propus. 
Această funcţie are ca valoare, la fiecare nivel al caracteristicii măsurate de test, 
probabilitatea ca răspunsul respectiv să fie ales. Dacă itemul este bine construit, 
atunci funcţia caracteristică a răspunsului corect va fi nedescrescătoare, în timp 
ce funcţiile caracteristice ale răspunsurilor greşite vor fi necrescătoare; nici una 
dintre funcţiile caracteristice nu va fi constantă pe întreaga mulţime de definiţie. 


Exemplu. 


cunostinte 


Figura 12.6.1.2.1 
Curbele caracteristice ale răspunsurilor la un item 
cu alegere multiplă 


În figura 12.6.1.2.1 sunt prezentate functiile caracteristice ale 
răspunsurilor A (corect), B, C si D ale unui item cu alegere multiplă dintr-un 
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test de cunoştinţe. Se observă că numai răspunsul greşit B are funcţia caracteris- 
tică descrescătoare. Răspunsul C este ales mai frecvent de subiecţi bine pregă- 
titi; este posibil ca el să nu fie formulat clar, deci trebuie verificat. Răspunsul D 
este ales foarte rar şi frecvenţa alegerii sale nu depinde de nivelul cunoştinţelor 
celor testati. El este ineficient ca factor de distragere şi trebuie eliminat. 


12.6.1.3. Validitatea itemilor 


În general, pentru aprecierea validității itemilor se apelează la un 
criteriu extern, de exemplu la scorurile unui test care măsoară sau prezice acelaşi 
lucru ca şi testul analizat. 

Se spune că un item este valid, dacă el poate fi folosit la evaluarea 
caracteristicii măsurate de variabila criteriu. 

De obicei, pentru estimarea validității se calculează coeficientul de 
corelaţie între scorurile itemului şi valorile variabilei criteriu. Acesta este 
denumit "indice de validitate" al itemului. Presupunând că variabila criteriu este 
continuă, tipul coeficientului de corelaţie utilizat va depinde de tipul itemului, 
mai precis de numărul scorurilor posibile ale itemului. | 

În cazul itemilor dihotomici, cărora li se acordă un punct dacă sunt 
rezolvaţi corect şi zero puncte dacă sunt rezolvati greşit sau nerezolvaţi, 
validitatea poate fi măsurată cu ajutorul coeficientului de corelaţie 
punct-biserială: 


Mo Mod — 
Gu 
"bis = VPq (12.6.1.3.1) 
0 
y 
unde: 
P = frecvența relativă a celor care au rezolvat corect itemul, egală cu 
“scorul mediu al itemului; 

q îi l-p . e ° . . Lă 
0, = abaterea standard a valorilor variabilei criteriu; 


Mc, Mg = media valorilor variabilei criteriu pentru cei care au rezolvat itemul 
corect, respectiv pentru cei care au greşit sau nu l-au rezolvat, 

Corelaţia punct-biserială este: un caz particular al corelaţiei 
produs-moment. Ea corespunde situaţiei când una dintre variabile ia doar două 
„valori. 

Dacă testul este administrat cu limită de timp, atunci vor fi luate în 
considerare pentru. calculul corelatiei numai persoanele care au parcurs itemul. 
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Verificarea semnificației statistice a coeficientului de corer 
punct-biseriala se face folosind testul ¢ (Student): 


d U : 
a E (12.6.1.3.2) 


{1 -réis 


unde N reprezintă numărul persoanelor care au parcurs itemul. 

„ Itemul este considerat valid, dacă £> ty... ty. 2a fiind valoarea citită din 
tabelele legii z, care corespunde pragului de semnificaţie ales a şi la N-2 grade 
de libertate. 

Se mai poate studia validitatea itemului prin analizarea diferenţei 
mediilor Mc şi Mg. Presupunând că în cele două grupe determinate de valorile 
scorului la item (cei cu scorul 1 şi cei cu scorul 0) variabila criteriu este. 
repartizată normal şi are aceeaşi dispersie, se calculează valoarea t folosind 
formula: 

M, -M, | 
tay = — MM pa | ~ (12.6.1.3.3) 


9, 


şi se compară cu valoarea in) 2a Citită din tabele. Dacă dp ?nba » atunci se 
consideră că itemul este valid. 

Pentru itemii al căror scor poate lua mai mult de două valori, validitatea 
poate fi estimată cu ajutorul coeficientului de corelaţie liniară între scorurile la 
item şi valorile variabilei criteriu. | 

Interpretarea valorii acestui coeficient se face la fel ca în cazul 
coeficientului de corelaţie punct-biserială, utilizând testul ¢. 

Atunci când. este măsurată printr-un coeficient de corelaţie liniară, 
validitatea itemului arată cât de puternică este le liniară dintre scorurile 
itemului şi valorile variabilei criteriu. — 

Uneori este foarte greu sau chiar imposibil de găsit o variabilă criteriu 
pentru validarea itemilor unui test. În cazul testelor de cunoştinţe asemenea 
situaţii sunt frecvente. 

Dar, dacă specialiştii apreciază că un test, în ansamblu, este valid, adică 
măsoară duidstintete din domeniul pentru care a fost construit, atunci scorurile 
testului pot fi utilizate, in locul valorilor unei variabile criteriu, la validarea 
itemilor care compun testul. Este adevărat că rezultatele vor fi distorsionate de 
faptul că în calculul scorului total al testului se ia în considerare şi scorul 
itemului, dar, dacă numărul itemilor din test este mare, influenţa fiecărui item 
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este redusă. Vor fi consideraţi valizi itemii care măsoară acelaşi lucru ca şi 
întregul test. În acest caz denumirea de indice de validitate este înlocuită ce 
aceea de indice de discriminare şi consistenţă internă (Davis, 1955). Totuşi, 
Standards for Educational and Psychological Tests (1974) consideră că 
asemenea coeficienţi nu măsoară validitatea itemilor. 


12.6.1.4. Indicele de discriminare al unui item 


Noţiunea de putere de discriminare a unui item vine să o completeze pe 
cea de validitate a itemului. Pentru estimarea ambelor este necesară existenţa 
unei variabile criteriu. Uneori - mai frecvent în cazul testelor de cunoştinţe - 
drept variabilă criteriu poate servi testul din care face parte întrebarea. 

În general, se apreciază că un item are putere de discriminare dacă 
examinatii cu valori mari la variabila criteriu au şanse mai mari să rezolve 
itemul decât cei care au valori scăzute. O asemenea comportare este de aşteptat 
în cazul itemilor valizi, ale căror scoruri sunt corelate liniar şi pozitiv cu valorile 
variabilei criteriu. Din acest motiv, în literatura de specialitate problema 
validității itemilor şi cea a puterii lor de discriminare se confundă uneori, deşi 
metoda utilizată pentru aprecierea puterii de discriminare nu garantează 
întotdeauna validitatea itemului. | 

© O posibilitate de evaluare a puterii de discriminare a unui item o 
constituie metoda grupelor contrastante (Murphy şi Davidshofer, 1987), 
aplicabilă atunci când testul a fost administrat unui număr mare de persoane. 
Din mulţimea celor examinati se formează două loturi: | 

© grupa "buna", compusă din cei care au cele mai mari valori la 

variabila criteriu; | ; 

© grupa "slabă", alcătuită din cei care la variabila criteriu au obţinut 

valorile cele mai mici. 

Dacă valorile variabilei după care se face împărţirea în grupele 
contrastante sunt repartizate conform legii normale, grupele vor conţine câte 
27% din totalul persoanelor. Dacă repartiţia frecvenţelor valorilor se abate mult 
de la legea normală, se vor forma grupele din câte 33% dintre persoane. În 
general, procentele persoanelor incluse în grupa bună şi în grupa slabă vor fi 
aproximativ egale, fiind cuprinse în intervalul [25, 33] (M.J. Allen şi W.M. 
Yen, după Gregory, 1992). 

Pentru fiecare item se calculează indicele de discriminare: 

Damen © (12.6.1.4.1) 


unde: 
Nz, Ns = numărul de persoane în grupa bună, respectiv în grupa slabă. Dacă 
testul a fost administrat cu limită de timp, atunci N, şi Ns vor reprezenta 
„numărul de persoane care au parcurs itemul, în fiecare din cele două 
grupe; 
Cz, Cs = numărul persoanelor care au rezolvat itemul corect, în grupa bună, 
respectiv în grupa slabă. | 

Deci, indicele de discriminare este diferenţa a T frecvențe relative. 
El variază între -1 (când toți cei din grupa slabă au rezolvat itemul corect $i toți 
„cei din grupa bună au greşit) şi +1 (când itemul a fost rezolvat corect de toţi cei 
din grupa bună şi greşit de toţi cei din grupa slabă). Cu cât indicele de 
discriminare este mai ridicat, cu atât mt reuşeşte mai bine să diferentieze 
între cei "buni" şi cei "slabi". 

Valoarea indicelui de discriminare, D, este dependentă de cea a 
indicelui de dificultate, p. Atunci când toți examinatii rezolvă corect itemul . 
(p=1) sau când nimeni nu răspunde corect (p=0), itemul nu diferenţiază între cei 
buni şi cei slabi. Dacă valoarea p este apropiată de 0 sau de 1 capacitatea de 
discriminare a itemului este redusă. Cel mai mare potenţial pentru a fi buni 
discriminatori îl au itemii al căror indice de dificultate este apropiat de 0.5. 

Ori de câte ori se obţine o valoare negativă a indicelui de discriminare 
la un item cu alegere multiplă, este necesar să se revadă răspunsurile propuse. 
Când unul sau mai multe dintre răspunsurile greşite par foarte plauzibile unui 
examinat care are un nivel înalt al variabilei măsurate de test (inteligenţă, 
cunoştinţe etc.) şi când recunoaşterea răspunsului corect depinde de un element 
extrem de subtil, este posibil ca examinatii cu un nivel mediu al variabilei 
evaluate să fie penalizati. La un test de cunoştinţe, de exemplu, cei care nu 
cunosc nimic şi aleg la întâmplare, având şanse să nimerească răspunsul corect, 
pot să obţină un punctaj mai bun decât cei care au cunoştinţe parţiale şi sunt 
derutati de modul in care sunt formulate SIGE |G propuse. 


"În cazul întrebărilor dihotomice, atunci când numărul persoanelor . 
examinate este mai mare de 20 şi efectivul celor două grupe este acelaşi 
(Np=Ns), valoarea indicelui D permite următoarele aprecieri (Guilbert, 1987): 


D = 0.35 item excelent; 

0.25 < D < 0.35 item bun; 

0.15<D<0.25 item la limita - de revizuit; 

D<0.15 item slab - de reexaminat atent si, Brabant de 


eliminat. 
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Un item poate avea un indice de discriminare convenabil, fara a avea 
o validitate bună. Un asemenea caz corespunde următoarei situaţii: un item 
dintr-un test de cunoştinţe pare uşor celor care au un nivel mediu al 
cunoştinţelor, în realitate, el conţine o greşeală de formulare care face ca două 
dintre răspunsurile propuse să fie la fel de plauzibile. Examinatii bine pregatiti 
au dubii în legătură cu răspunsul corect şi din acest motiv greşesc mai frecvent 
decât ceilalţi. Curba de regresie a scorurilor la item fata de scorurile variabilei 
criteriu este prezentată în figura 12.6.1.4.1. 


Figura 12.6.1.4.1 
Un item care discriminează bine dar nu este valid 


Ţinând cont de faptul că indicele de discriminare se exprimă cu ajutorul 
a două frecvențe relative, pentru interpretarea corectă a valorii sale se poate 
aplica un test statistic. Astfel, dacă efectivele celor două grupe sunt mari (N30 
şi N30), atunci compararea frecvențelor relative P3Cp/Ny Şi Ps=Cs/Ng se poate 

face cu ajutorul testului z. Se calculează valoarea z cu formula: 
Pp Ps | 

2: = 

| ] | (12.6.1.4.2) 
P(1 =p)(— +—) 
| Ng Ns 


unde: 
_ CptCg 


WEN, (12.6.1.4.3) 
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şi se compară cu valoarea z, citită din tabelul legii normale, corespunzătoare 
pragului de semnificaţie @ ales. Dacă z>z, atunci se apreciază că puterea de 
discriminare a itemului este satisfăcătoare. 

O deficiență a metodei prezentate pentru calculul indicelui de 
discriminare constă în faptul că elimină din prelucrare mai mult de o treime din 
totalul celor examinati. În plus, indicele de discriminare astfel calculat nu ne 
spune cum diferenţiază itemul între persoanele din fiecare grupă, ci doar dacă, 
în cadrul întregului eşantion, face deosebire între cei mai buni şi cei mai slabi. 

Analog indicelui de discriminare D, utilizat pentru itemii dihotomici, 
se poate defini un indice de discriminare valabil în cazul itemilor al căror scor 
admite mai multe valori: | | 

Dy, = Mp - My (12.6.1.4.4) 
unde M; si M; reprezintă media scorurilor itemului in grupa buna, respectiv in 
cea slabă. 

Această formulă este mai generală decât cea a indicelui D; dar, dacă 
itemul este dihotomic, atunci D,, coincide cu D. pt N 

Se consideră că itemul este satisfăcător în privinţa puterii sale de 
discriminare dacă diferenţa mediilor M, şi Msg este semnificativă statistic. Pentru 
compararea mediilor se poate utiliza testul ¢. Presupunând că scorurile itemului 
sunt repartizate normal şi au aceeaşi dispersie în cele două grupe, se calculează: 


N 
(Vp Doza 102 | ABS. (12.6.1.4.5) 
Np+Nş2 


unde 0; şi a, reprezintă dispersia scorurilor itemului în grupa bună, respectiv 
în grupa slabă. i | 
Dacă / este mai mare decât valoarea tno Citită din tabelele legii ¢ pentru 
m=Ny+Ns2 grade de libertate şi pragul de semnificaţie a, se considera că itemul 
are o putere de discriminare satisfăcătoare. , 
Indicele de discriminare D,, la fel ca şi D, arată doar în ce măsură o 
întrebare diferenţiază între o grupă bună şi una slabă. El nu spune nimic despre 
felul in care itemul discriminează întie indivizi care au niveluri diferite ale 
variabilei măsurate sau prezise de test. | 
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12.6.1.5. Indicele de fidelitate al itemului 


Acest indice serveşte la aprecierea contribuţiei pe care şi-o aduce itemul 
la asigurarea unei bune consistente interne a testului, l 

Conform formulei (8.4.2.2), indicele de fidelitate este dat de produsul 
dintre abaterea standard a scorurilor sale, g, şi coeficientul de corelaţie liniară 
dintre scorurile itemului şi scorurile testului, (YX): 

REY )=GAY,X) 


Din formula de calcul a coeficientului gal lui Cronbach, (8.4.2.3); 


se observa că testele alcătuite din itemi cu valori mari ale indicilor de fidelitate 
au o consistenţă mare. | 

Este dificil de apreciat contribuţia pe care şi-o aduce dispersia scorurilor 
itemului la mărimea coeficientului de consistenţă internă, întrucât în expresia 
coeficientului a abaterea standard a scorurilor itemului, 0, apare atât la 
numărătorul, cât şi la numitorul raportului care se scade din 1. Dar, pentru 
obţinerea unei valori cât mai mari a coeficientului @ este important ca itemii care 
vor fi introduşi în test să aibă corelaţii liniare mari, pozitive, cu scorul total al 
testului. 


12.6.1.6. Observaţii asupra analizei de itemi 


Analiza itemilor unui test se poate face conform următorului algoritm: 


(1) Se calculează indicele de dificultate pentru toţi itemii Şi se elimină 
itemii rezolvati de toate persoanele şi cei nerezolvati de nici un subiect, 


(2) Se încearcă depistarea cauzelor pentru care unii indici de dificultate 
sunt foarte mari sau foarte mici şi, pe această bază, se elimină itemii cu greşeli. 


(3) Pentru itemii cu răspunsuri la alegere, se analizează răspunsurile 


„incorecte şi se elimină itemii în care unele răspunsuri greşite propuse au fost 
alese de foarte mulţi sau de foarte puţini subiecţi. | 


225 


. (4) Se aplică un procedeu al analizei de itemi determinat de PEN 
pe care trebuie să le îndeplinească testul care se construiește: 

. @ Dacă testul trebuie să discrimineze între două grupe contrastante, mai 
precis, să furnizeze scoruri care să difere mult de la o grupă la alta, 
atunci se calculează pentru fiecare item indicele de discriminare şi se ` 
elimină itemii necorespunzători din acest punct de vedere. 

e Dacă testul trebuie să se comporte într-un anumit fel fata de anumit 
` criteriu (să coreleze liniar pozitiv sau negativ ori, din contră, să nu 

coreleze semnificativ), atunci se vor elimina itemii care au o altfel de 

componere, ' | ) 


_ (5) Se elimină itemii cu indicele de dificultate. necorespunzător scopului 
pe care trebuie să îl îndeplinească testul: în general, se elimină itemii foarte 
uşori şi cei foarte grei, dar, dacă testul trebuie să identifice persoanele cu 
niveluri foarte scăzute sau foarte ridicate ale unei caracteristici, se vor reţine ` 
doar itemii uşori, respectiv dificili. i 


(6) Se calculează coeficientul de corelaţie între scorurile testului şi 
scorurile itemului şi se elimină itemii cu corelaţii nesemnificative sau negative. 


Din itemii rămaşi 'vor fi selectaţi cei care vor alcătui testul. Pentru testul 
rezultat se vor studia atât caracteristicile psihometrice (fidelitate, validitate, 
dificultate, putere de discriminare), cât şi lungimea testului, tipurile itemilor 
componenți şi, în funcţie de acestea, timpul de rezolvare a testului şi costurile 
administrării sale. 


12.6.2. Metode de selectare a itemilor pentru construirea unui test 
psihologic 


Metoda intuitivă (raţională) se utilizează pentru a obţine un test care 
să măsoare cu precizie diferenţele individuale în privinţa unei trăsături comune 
sau a unui atribut care prezintă interes ştiinţific şi care nu este măsurat adecvat 
prin nici o tehnică existentă (Edwards, 1970). Se deduce că această metodă 
urmăreşte formarea unui test pentru care sunt importante validitatea relativă la 
construct şi consistenţa internă. 

Se porneşte de la o mulţime de itemi care descriu comportamente 
specifice constructului la care. se referă testul, formulati pe baza intuiţiei 
autorului testului. De aici provine denumirea de "metodă intuitivă”. În unele 
lucrări, denumirea de "metodă raţională" se foloseşte ca un sinonim pentru 
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"metoda intuitivă", în alte lucrări este considerată "metodă raţională" doar cea 
care utilizează procedee statistice pentru selectarea itemilor din colecţia 
existentă (Henry, Sanford, 1972) 

_ Pentru a putea aplica formule statistice, itemii sunt administrati unui lot 
format din 200-400 de persoane (Edwards, 1970) şi se calculează coeficientul 
de consistenţă internă. Dacă acesta are o valoare prea scăzută se încearcă să se 
formeze testul dintr-un număr mâi restrâns de itemi. 

În general se utilizează două căi de selecţie a itemilor, ambele bazate pe 
scorurile acestora în cadrul eşantionului: 

e metoda consistenţei interne; 

e metoda teoretică. 


A. Metoda consistentei interne are mai multe variante. Vom prezenta câteva 
dintre acestea: 
| e Dacă numărul de itemi este mai mare decât 60, se elimină itemii care 
au covariante scăzute cu scorul total al testului, iar dacă numărul de itemi este 
mai mic decât 20, se adaugă itemi noi (Edwards, 1970). 
© Sunt eliminaţi itemii care au coeficienţi de corelaţie scăzuţi cu scorul 
total al testului (Henry, Sanford, 1972). AP 
i e Sunt îndepărtați itemii care au.o putere de discriminare scăzută, 
grupele contrastante utilizate pentru calculul indicelui de discriminare fiind 
formate pe baza scorurilor testului (Anastasi, 1976). 
Deficiența acestor metode constă în faptul că nu asigură selectarea 
acelor itemi care ar furniza cea mai mare valoare posibilă a coeficientului de 
fidelitate. În metodele consistentei interne fiecare item este comparat cu întregul 
test şi este posibil ca un item necorespunzător să provoace eliminarea unor itemi 
buni. 


B. Metoda teoretică (Shackleton, Fletcher, 1984) grupează itemii şi reţine 
itemii unei clase omogene. 
Pentru grupare se foloseşte un algoritm al analizei de clusteri. 
Prin acest algoritm la fiecare pas se construieşte pe mulţimea de itemi 
o partiție. În cadrul fiecărei partitii, clasa care se referă la constructul măsurat 
de test trebuie identificată prin analiza conţinutului itemilor. Se formează testul 
din itemii clasei respective şi se calculează coeficientul de fidelitate al testului. 
Deci, la fiecare pas al algoritmului există câte un test, Dintre acestea se alege cel. 
care are o fidelitate bună şi este compus dintr-un număr suficient de mare de 
itemi ca să poată diferenţia între subiecți. 
În privinţa modului de validare a testului construit prin metoda 
raţională, părerile sunt contradictorii. 
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4 

Edwards (1970) atrage atenţia că un asemenea test nu trebuie corelat cu 
nici un criteriu, deoarece un test se construieşte prin metoda raţională doar 
atunci când nu există nici o altă posibilitate de a:masura trăsătura la care se 
referă acesta. 

Anastasi (1976) propune să se studieze corelatia dintre testul construit 
şi alte teste similare existente, pentru a vedea dacă toate măsoară acelaşi lucru. 
Valorile coeficienţilor de corelaţie trebuie să fie mari, dar nu foarte mari, căci 
dacă se identifică o corelaţie puternică, fără ca noul test să aibă avantajul de a 
fi mai uşor de administrat, se poate considera că el nu este decât o dublură a 
testului existent şi nu prezintă nici un interes. 

DIT Campbell (Anastasi, 1976) apreciază că pentru a verifica 
validitatea relativă la construct a testului trebuie să se studieze corelatiile 
acestuia cu teste care se referă la variabile psihice despre care se consideră că 
au legătură cu constructul măsurat de test (validitatea convergentă) şi cu teste 
care vizează variabile psihice despre care se presupune că nu au legătură cu 
constructul măsurat de test (validitatea discriminantă). 


„ Metoda analizei criteriului intern (metoda analizei factoriale) 
(Mischel, 1968; Henry, Sanford, 1972; Kline, 1993) serveşte la construirea unui 
test destinat să măsoare un anumit factor, care se considera că reprezintă o 
variabilă de personalitate fundamentală. 

Sunt scrişi mai multi itemi. Aceştia sunt administrati unui lot de subiecţi 
împreună cu alte măsuri (teste, itemi etc.) care au fost identificate în cadrul unor 
cercetări anterioare ca având legătură cu variabila respectivă. Matricea 
intercorelatiilor scorurilor obţinute pentru toate măsurătorile efectuate este 
prelucrată prin analiză factorială. Se identifică factorul pe care trebuie să îl 
măsoare testul şi se retin numai itemii care au saturatii mari în factorul respectiv. 
Dacă este necesar, se schimbă modul de cotare a itemilor astfel încât toate 
saturatiile să fie pozitive. 

Trebuie menţionat că factorul comun unei grupări de itemi nu corespun- 
de, in mod obligatoriu, unei caracteristici "reale" sau "primare" a persoanelor 
examinate (Mischel, 1968). Factorii identificaţi prin analiză factorială sunt 
dependenţi de itemii prelucrati statistic, de subiecţii care au răspuns la test şi de 
metodele aplicate în cadrul analizei factoriale. Variabilele puse în evidenţă de 
analiza factorială reflectă doar corelaţiile dintre mai multe instrumente de 
măsură particulare (itemii testului). 

Prin metoda analizei factoriale este mai uşor să se construiască deodată 
mai multe teste decât unul singur. Aceasta deoarece pasul iniţial al analizei 
factoriale are tendinţa de a evidenția un factor general şi mai mulţi factori 
bipolari, iar prin rotația factorilor se reduce varianta factorului general (Kline, 
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1993). Prin urmafe, de la început se vor selecta itemi care să măsoare mai multi 
factori. Aceştia vor fi administrati unui lot format cam din 200 de persoane sau, 
‘in orice caz, care nu este mai mic de 100 de indivizi. Kline (1993) recomandă - 
ca numărul itemilor prelucrati să fie de două ori mai mare decât cel al itemilor 
care vor fi păstraţi în teste, iar numărul subiecţilor să fie de 3 ori mai mare decât 
numărul itemilor introduşi în analiza factorială. Astfel, de exemplu, dacă se vor 
construi 5 scale a câte 20 de itemi, atunci vor trebui administrati 2*5*20=200 

de itemi, unui lot format din 3*200=600 de persoane. ; 

În ceea ce priveşte tipul de rotaţie utilizat în analiza factorială, se va 
aplica o rotaţie ortogonală dacă există argumente teoretice în favoarea ideii că 
variabilele măsurate de testele care vor fi construite sunt necorelate liniar între 
ele; în caz contrar, se va aplica o rotaţie oblică. Pentru fiecare test vor fi selectaţi 
numai itemii care au saturatii mari într-un singur factor. 

Prin această metodă se obţin teste care măsoară câte un singur factor. 
Pentru a afla ce reprezintă acest factor, se va studia modul în care corelează 
scorurile testului cu diverse teste despre care se ştie ce măsoară. - | 

Această metodă se foloseşte atunci când se doreşte să se obţină teste cu 
o validitate relativă la construct bună. 


Metoda exploratorie (Ozer, Reise, 1994) se foloseşte pentru 
construirea testelor destinate să evalueze constructe care la început sunt 
incomplet înţelese. În paralel cu construirea testului se dezvoltă şi teoria care stă 
la baza sa. De fapt, această metodă transpune în practică spirala inductiv- 
ipotetico-deductivă a lui Cattell. 

Se începe cu o idee nefinisată despre un copstruct de personalitate şi se 
scriu cât mai mulţi itemi referitori la el. Aceştia sunt administrati unui lot de 
subiecţi. Răspunsurile obţinute nu sunt folosite pentru a studia şi îmbunătăţi 
calităţile psihometrice ale testului, ci pentru a genera teorii noi. Sunt scrişi alţi 
itemi, potriviti noii idei despre construct, iar răspunsurile obţinute servesc la o 
nouă evaluare a teoriei. Procesul se repetă până când se ajunge la un nivel 
satisfăcător de convergenţă a răspunsurilor. Itemii respectivi vor constitui testul. 


Metoda criteriului extern se utilizează de obicei în cazul testelor care . 
trebuie să aibă o validitate predictivă ridicată. 

Este foarte important ca itemii introduşi în prelucrare să se refere la 
aspecte cât mai diverse, să formeze o colecţie cât mai eterogena. Alegerea 
itemilor care vor intra în componenţa testului se bazează pe relaţiile, determinate 
empiric, dintre itemii testului şi o măsură particulară folosită drept criteriu. Din 
acest motiv, metoda este denumită şi "empirică" (Edwards, 1970; Henry, 
Sanford, 1972). 
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De obicei se studiază validitatea fiecărui item relativ la acel criteriu şi 
se elimină itemii care nu sunt valizi. — | | | 

Uneori, criteriul împarte indivizii în două clase contrastante: unii, 
pentru care o anumită trăsătură, caracteristică sau aptitudine este foarte 
accentuată, formează grupul "criteriu", iar ceilalţi constituie grupul "de control". 
În acest caz se studiază puterea de discriminare a itemilor şi se elimină itemii 
care nu discriminează între grupurile contrastante. | 

Cele două grupuri contrastante trebuie să conţină, împreună, cel puţin 
200 de persoane, dacă toate sunt de acelaşi sex, sau cel puţin 200 de bărbaţi şi 
200 de femei. În cel de-al doilea caz, se selectează doar itemii care discrimi- 
neaza intre grupurile contrastante pentru ambele sexe. 

Adesea, criteriul care stă la baza împărţirii persoanelor în cele două 
grupuri este multidimensional. Din acest motiv, este posibil ca testul format din 
itemii reţinuţi să nu diferentieze suficient de bine între grupuri. Sau este posibil 
ca fiecare item să se refere la un alt aspect al criteriului; aceasta face ca 
intercorelatiile itemilor să fie reduse şi, deci, consistenţa internă a testului să fie 
scăzută. Pentru a înţelege ce măsoară testul (care sunt factorii care discriminează 
între grupurile contrastante) se pot prelucra prin analiză factorială itemii reţinuţi 
împreună cu itemi ai altor teste, care se ştie ce măsoară, şi apoi se vor identifica 
factorii obţinuţi. Vu 


Metoda analizei constructului (Oosterveld, Vorst, 1995) se bazează 
pe corelaţiile itemilor cu diverse variabile care, conform teoriei ce stă la baza 
elaborării testului, au legături sau, din contră, nu trebuie să aibă legături cu acest 
construct. Itemii ale căror corelaţii sunt necorespunzătoare se elimină. 

Această metodă se aseamănă cu metoda empirică, doar că aici se 
folosesc mai multe criterii, inclusiv unele cu care itemii trebuie să nu coreleze 
„semnificativ. Aplicarea metodei constructului necesită existenţa unei reţele 

nomologice care să includă constructul măsurat de test. | 


„Alte metode de construire a testelor 


Algoritmii pe care îi prezentăm în continuare construiesc un test 


pornind de la o colecţie de itemi dihotomici şi de la un item fixat, apreciat ca 
fiind reprezentativ pentru ceea ce testul trebuie să măsoare sau să prezică. 

La fiecare pas se adaugă un item testului existent în acel moment. 
Itemului adăugat (care se alege astfel încât să maximizeze coeficientul. de 


consistență internă, respectiv un coeficient de discriminare între grupele 


contrastante) i se impune să aibă funcţia de regresie fata de scorurile testului 
existent nedescrescătoare. În plus, se ţine cont şi de următoarea observaţie: 
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Este posibil ca fiecare dintre itemii i}, i,,..., i, să aibă funcţia de regresie 
‘ monotonă fata de testul format din ei, itemul i,,, să aibă funcţia de regresie 
“monotonă fafa de testul alcătuit din itemii i}, i,,..., îm ipp dar să existe cel putin 
un item i, jé{1, 2, ..., n) a cărui funcţie de regresie fata de testul format din 
itemii i), izn... În Să nu fie monotonă. ATÈ 
Din acest motiv nu se adaugă un item testului decât după ce se verifică dacă 
toți itemii existenți în test au funcții de regresie monotone față de testul care s-ar 
forma prin adăugarea itemului. 
Algoritmii aplică următoarele formule de calcul: 
® Scorul testului se obține prin însumarea cotelor itemilor componenți. 
e Pentru determinarea funcției de regresie a unui item față de test se 
aplică metoda celor mai mici pătrate folosind polinoame de gradul al III-lea. 
Concret, dacă testul este alcătuit din n itemi: i}, i,,..., i, scorurile posibile fiind 
0, 1, ...„ n şi dacă pentru fiecare item i, (4=1,2,...„n) notăm cu p; funcţia: 
Pr: 40, 1,..., n} > [0,1] i 


( frecvența relativă a persoanelor care obțin un 
| punct la itemul i din totalul celor care au 
realizat ¢ puncte la test, =1, 2,..., n 
PAD) = 


40,720 i 
atunci se determină funcția de regresie a itemului i, fata de test,,c , care 
îndeplineşte următoarele condiţii: ME | 
Cp: [0,71] > [0,1] 


ce {agta xtax’ tax’ | 9,4 1,4 7,3ER} 
n ș 
Xe IPA: oF 
I= 


ia valoarea minima. ae 

Se observa ca prin conditiile impuse nu s-au eliminat dreptele de regresie. 
Ele corespund cazului când c, este un polinom de gradul întâi pe intervalul 
[0,n]. Dar, pentru unii itemi i, se poate găsi o funcţie ¢ care să aproximeze 
punctele p,(0), p,(1),..., pun) mai bine decât dreapta de regresie şi, în plus, să 
imite mai bine alura funcţiei p, punând în evidenţă eventualele schimbări de 
monotonie, ceea ce polinoamele de gradul întâi nu sunt capabile să facă. 


A. Un algoritm de construire a unui test cu o consistenţă internă ridicată 

(Albu, Pitariu, 1992b) 
Algoritmul pe care îl prezentăm în continuare construieşte un test psihologic 

prin extragerea itemilor dintr-o mulţime de itemi dihotomici M, astfel încât: 
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e funcţia de regresie a fiecărui item al testului este nedescrescătoare fata 
de test; . S 
e la testul existent la un moment dat se adaugă acel item care produce 
cel mai mare coeficient de fidelitate Kuder-Richardson, px. 
Algoritmul se compune din următorii paşi: 


Pasul 1: M = (ip, i,,..., ia) este mulţimea de itemi; 
ig este itemul de pornire; . 
S := {ig} este testul construit 
k := 1 este numărul de itemi ai testului s 
Pasul 2 : P=Ø 
Pentru fiecare item ¿€M se determină funcţia de regresie a itemului i; fata 
de testul sU {i} şi, dacă aceasta este nedescrescătoare, se pune P := P U (i pe 
Pasul 3: Data P=@, se trece la pasul 8. 
Pasul 4: Se pune KRMAX := 0 şi IMAX := xq 
Pasul 5 : Pentru fiecare i¢P : 
e se calculează, folosind scorurile testului 5,3 = sU {i} ierta de 
fidelitate p al testului s); KR(s;); 
e daca KR(s,) > "KRMAX, se pune KRMAX := = KR(s 5;)) şi JMAX := =j 
Pasul 6 : Pentru fiba item i,€5U (inu) : 
i e se determină funcția de regresie faţă d de testul sU {i nyy}; 
© dacă aceasta nu este nedescrescătoare, se elimină itemul i imax din 
multimea P : 
P= PI fined 
si se trece la pasul 3. 
Pasul 7 : Se adaugă itemul i pyy testului s şi se elimină din M : 
s = SU {i yag 
M := M\ fina 
k := k+] d 
Dacă M+0 se trece la pasul 2. 
Pasul 8 : STOP 


S-a obţinut testul s cu k itemi. 
Algoritmul poate fi modificat, introducând condiţia de oprire dacă valoarea 


coeficientului de fidelitate se află sub un anumit prag sau atunci Sar valorile 
coeficienţilor P scad de la un pas la alhul: 
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B. Un algoritm de construire a unui test care si discrimineze bine intre 
doua grupe contrastante (Albu, Pitariu, 1991b) 

Acest algoritm serveşte la construirea unui test care să discrimineze cât 
mai bine între două grupe contrastante, G, şi G,, apreciate a fi foarte deosebite 
în privinţa variabilei la care se referă testul. 

El urmăreşte ca: a. 

e itemii introduşi în test să aibă funcţia de regresie fata de test 
nedescrescatoare; | 

© scorurile medii ale testului în cele două grupe, G, şi G,, să fie cât mai 
diferite posibil; 

e în cadrul fiecărei grupe, scorurile testului să fie cât mai apropiate de 
scorul mediu al grupei. 

Ultimele două condiţii de mai sus sus au fost formulate matematic cu | 
ajutorul funcției C: - 

C:S->R 
C(s)= N | 
(12.6.2.1) 


unde : 
S = mulţimea tuturor testelor care se pot forma cu itemii mulţimii M; 
S = un test din S; 
pentru î=1,2: 
n, = volumul grupei G;; 
m, = scorul mediu al testului s în grupa G; 
0; = dispersia scorurilor testului s în grupa G,. 
Înainte de aplicarea algoritmului se verifică modul de cotare a itemilor, 
astfel încât fiecare item să aibă media scorurilor mai mare în grupa G}. 
Algoritmul se compune din următorii paşi: 
Pasul 1: M := {i}, i,..., i) este mulţimea de itemi; 
sS := © este testul construit 
k := 0 este numărul de itemi ai testului s 
Pasul 2 : Se pune P:=0 
Pentru fiecare item i, e M: 
e dacă s = Ø se pune P := P U {ij}; 
e dacă s+0), se determină funcţia de regresie a itemului i, faţă de testul sU{i} 
şi, dacă aceasta este nedescrescatoare, se pune P:=PU {i}. 
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Pasul 3 : Daca P=0), se trece la pasul 7. 
Pasul 4: Se pune CMAX := 0 şi JMAX := 0 
Pentru fiecare item ie? : 
e se calculează, folosind scorurile testului s,:=sUţi aE 


m, -m 
C(s) Ste gl UCN 


e daca C(s,) > CMAX, se pune CMAX := C(s;) şi JMAX :=j 
Pasul 5 : Pentru PER item i,,€sU {iny : 
e se determină funcţia de regresie față de testul sU{i MAXS 3 
e dacă aceasta nu este nedescrescătoare, se elimina itemul iggy din « 
mulţimea P : 
P: =P \ {imax} 
şi se trece la pasul 3. 
Pasul 6 : Se adaugă itemul i pyy testului s şi se elimină din M: 
s > SU {i pax) 
M = M\ {img 
k:=k+1 
aes M+0 se trece la pasul 2. 
Pasul 7 : STOP 
„S-a obţinut testul s cu kitemi. 


: 12.7. EXPERIMENTAREA SUPLIMENTARĂ A TESTULUI 


Efectuarea unei verificări suplimentare a testului, folosind un eşantion 
de persoane asemănător celui folosit pentru construirea sa, este necesară ori de 
câte ori alcătuirea testului s-a realizat prin selecţia itemilor dintr-o bancă de 
itemi pe baza răspunsurilor date de subiecţi (deci itemii nu au fost aleşi de 
urii) Adică, s-a format un test care este "cel mai bun posibil" sau unul dintre 

"cele mai bune posibil" pentru eşantionul de persoane folosit, ţinând cont de 
itemii care au fost administrati şi de criteriul de optim utilizat (de exemplu, s-a 
urmărit maximizarea fidelității sau a validității relative la criteriu). La formarea 
testului şi-au adus contribuţia şi diverşi factori legaţi de şansa care a acţionat în 
eşantionul de persoane care a participat la construirea testului dar care s-ar putea 
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să nu mai fie prezenţi în alte ocazii de testare, cu alţi subiecţi. Din acest motiv 
trebuie verificată comportarea testului şi într-un alt lot de persoane. 

În literatura de specialitate se recomandă ca după alcătuirea testului să 
se efectueze o validare suplimentară (cross-validation). Prin aceasta se 
verifica, folosind ecuatia de regresie a scorurilor testului fata de un criteriu, daca 
testul prezice criteriul într-un eşantion nou de subiecţi la fel de bine ca în 
eşantionul original (Gregory, 1992). În practică s-a constatat o scădere a valorii 
coeficientului de validitate prin schimbarea lotului de subiecţi (validity- 
shrinkage). 

Alături de studiul validității testului, este bine că în noul eşantion să se 
cerceteze şi fidelitatea, dificultatea şi sensibilitatea testului. in ANY 

| În această fază de experimentare suplimentară a testului se verifică nu 

numai calităţile psihometrice ale acestuia ci şi felul în care au fost redactate 
instrucţiunile de administrare şi au fost editati itemii. 

Pentru a se observa eventualele deficienţe, este util să li se dea 
subiecţilor un chestionar de opinie, pe care să îl completeze imediat după ce au 
terminat de răspuns la test. Un asemenea chestionar este anonim şi conţine 
întrebări la care se răspunde prin "da" sau "nu" şi, eventual, se cere justificarea 
unuia dintre răspunsuri. Exemple de asemenea întrebări sunt următoarele: ` 


e Condiţiile de testare (temperatură, lumină, ventilaţie etc.) au fost satisfa- 
cătoare? (DA/NU) 
Dacă răspunsul este NU, explicati ce v-a nemulţumit. 
© Instrucţiunile de lucru au fost complete? (DA/NU) 
Dacă răspunsul este NU, ce ar fi trebuit spus în plus? 
e [Instrucţiunile de lucru au fost clare? (DA/NU) 
, Vaca răspunsul este NU, ce a fost neclar? - 
e Textul itemilor a fost uşor de înţeles? (DA/NU) 
Dacă răspunsul este NU, unde aţi avut dificultăţi? | 
e Modul în care a trebuit să completaţi răspunsurile a fost simplu? (DA/NU) 
Dacă răspunsul este NU, ce a fost dificil? 
e Timpul de lucru a fost suficient? (DA/NU) 
e Afi răspuns la toţi itemii? (DA/NU) 
Dacă răspunsul este NU, de ce? 
e Vi s-a părut bun testul? (DA/NU) 
Dacă răspunsul este NU, ce nu v-a plăcut?) 
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12.8. TRADUCEREA SI ADAPTAREA UNUI TEST 


Pentru aplicarea unui instrument de măsură într-un grup cultural nou nu 
este totdeauna suficientă traducerea textului itemilor şi a instrucţiunilor de 
administrare. Uneori este necesară adaptarea testului, prin înlocuirea unor itemi 
care nu se potrivesc noii populaţii, alteori, testul trebuie reconstruit. Aceasta, 
deoarece între populaţia căreia i-a fost destinat testul iniţial şi noua populaţie pot 
exista deosebiri în ceea ce priveşte (Van de Vijver, Hambleton, 1996): 


a. comportamentele asociate constructului măsiirat de test: 
De exemplu, pentru constructul "pietate filială", comportamentele 
„asociate cu ceea ce se înţelege prin "a fi un fiu bun" (a avea grijă de părinţi, a 

le satisface cerinţele, a-i trata bine) sunt mult mai numeroase în China decât în 
Europa de. Vest. E 

Se impune cercetarea modului în care este înțeles constructul în viata 
zilnică si a comportamentelor asociate lui. Se’ pot identifica astfel itemii 
nepotriviti noii populatii. 


b. obisnuinta persoanelor cu situaţia de testare ori cu for ma particulară 
a testului; 
| Lipsa obişnuinţei de a răspunde la teste (în general sau la teste de acest 
tip) influenţează asupra răspunsurilor la un număr mare de itemi sau chiar la toți 
itemii, pr oducând anasan ale scorului total al testului între cele două populații. 


c. răspunsurile date la unii itemi din test, care nu sunt potriviti noii 
populatii. 

Aceasta situatie poate fi identificata detail: pentru. persoane din 
populaţii diferite care au acelaşi scor total la test, dacă există itemi la care 
răspunsurile sunt diferite. Studiul statistic se bazează în acest caz pe analiza de 
varian{a, variabila dependentă fiind scorul itemului, iar variabilele independente, 
populaţia şi scorul total al testului. 


După efectuarea unei cercetări comparative, pentru identificarea ite- 
milor la care răspunsurile se deosebesc între populaţii şi depistarea cauzelor, se 
va decide cum trebuie procedat pentru a putea utiliza testul şi în noua populaţie. 

În anul 1993 a fost format un comitet internaţional (International Test 

*Comission), compus din.specialişti din diverse domenii ale psihologiei, care, în 
1996, au redactat un set de reguli pentru traducerea testelor (Van de Vijver, 
aioe 1996). 
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CAPITOLUL 13 
INTERPRETAREA SCORURILOR TESTELOR. 
PSIHOLOGICE 


13.1. PRINCIPII GENERALE 


Scorul obţinut de o persoană la un test, indiferent de formula utilizată 
pentru calculul acestuia (însumarea scorurilor itemilor, ponderate sau nu, 
aplicarea formulei de corecție pentru şansa succesului etc.), se as ad cota 
bruta. 

Valoarea sa.nu aduce nici o informaţie despre priceperile sau 
cunoştinţele subiectului. Faptul că un elev a obţinut 60 de puncte la un test de 
atenţie concentrată nu ne spune dacă a realizat o performanţă bună, mediocră 
“sau slabă. O cotă brută dobândeşte semnificaţie doar dacă ea este raportată: 

e Ja baremuri fixate 
sau 

e la scorurile realizate de alti subiecţi 
sau 

e Ja cota brută obţinută de aceeaşi persoană la o testare anterioară. 

Prima situaţie este întâlnită mai ales la testele centrate pe criteriu si la 
cele folosite în selecţie. Uneori, baremul la care se face raportarea rezultatelor 
unui test este reprezentat de o singură valoare de scor. Aceasta poate fi un scor 
de sectionare (cutoff score) sau un scor critic (critical score) (Truxillo, Donahue, 
Sulzer, 1996). 

Scorul de seeţionare este un prag care serveşte la împărţirea subiecţilor 
în două categorii: “acceptaţi” (cei care au un scor superior scorului de 
sectionare) şi "respinşi" (celelalte persoane). Uneori, scorul de sectionare este 
stabilit de specialişti, care apreciază nivelul minim de cunoştinţe, deprinderi ori 
priceperi necesare pentru a obţine succes într-o profesie, la un curs de calificare 
sau specializare ete. De exemplu, la un test de cunoştinţe, ei decid numărul 
minim de întrebări la care o persoană trebuie să răspundă corect pentru a fi 
declarată "admisă". Alteori, scorul de sectionare se fixează în urma administrării 
testului la două grupe contrastante de persoane, astfel încât majoritatea 
scorurilor obţinute de grupa "buna" să se situeze într-o parte a sa, iar majoritatea 
scorurilor din grupa "slaba"in cealaltă parte. Se recurge la fixarea unui scor de 
sectionare nu numai în cazul selecţiei profesionale, pentru a elimina o parte din 
candidaţi, ci şi la alte examinări psihologice, pentru a le oferi un feedback | 
subiecţilor, care, de multe ori, sunt mai puţin interesaţi de locul pe care îl ocupă 
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în clasamentul întocmit pe baza rezultatelor testării, decât de faptul că "au 
trecut" sau "au căzut" la test (Truxillo, Donahue, Sulzer, 1996). _ 

Scorul critic serveste la diferentierea persoanelor care au succes de cele 
care au insucces intr-un anumit domeniu. De obicei stabilirea acestui scor 
utilizează ecuaţia de regresie liniară dintre criteriu şi predictor, el având rolul de 
a-i identifica pe subiecţii care au valori mari la criteriu, pe baza scorurilor 
obţinute la test.Celelalte două modalităţi de interpretare a scorului se întâlnesc 
la majoritatea testelor normative. 

„Dar, indiferent de felul in care se procedează pentru a desprinde 
concluzii din rezultatele unei testări psihologice, este bine să se tind seama de 
următoarele recomandări (Gronlund, 1967): 


A. Înainte de a interpreta scorurile obţinute la un test se va studia 
manualul testului, pentru a cunoaşte exact semnificaţia variabilei măsurate sau 
prezise de test. Simpla denumire a testului nu aduce suficiente informaţii pentru ` 
o interpretare corectă. Un "test de aritmetică", de exemplu, poate conţine 
exerciţii simple de calcul sau probleme de raţionament. 


B. Nu se pot face deductii corecte numai pe baza unui scor de test. 
Scorul reflectă, pe lângă mărimea variabilei măsurate de test, şi aptitudinile 
persoanei, influenţele exercitate asupra ei de mediul cultural din care face parte 
"şi de programul instructiv-educativ urmat, adaptarea emoţională, starea de 
sănătate etc. Un scor scăzut poate fi cauzat, de pildă, de neintelegerea termenilor 
utilizaţi de test sau de lipsa motivatiei. 


C. Când se interpretează rezultatele unei testări psihologice se va avea 
în vedere la ce vor servi concluziile la care se va ajunge. De exemplu, un scor 
la un test de inteligenţă are semnificaţie diferită, după cum se doreşte să se 
selecteze elevi pentru a forma o clasă de copii capabili de performanţe 
superioare ori se urmăreşte să se decidă dacă subiectul trebuie îndrumat spre 
liceu sau spre o şcoală profesională. 


D. Este preferabil ca interpretarea rezultatelor la un test să se bazeze nu 
pe scorurile observate, ci pe intervalele de încredere ale scorurilor reale. Această 
recomandare figurează şi în Standards for Educational and Psychological Tests 
din 1974. 


E. Orice scor obţinut la un test este afectat, mai mult sau mai puţin, şi 


de erori de măsurare a căror mărime nu poate fi determinată. Din acest motiv, 
se va evita să se ia decizii importante pe baza unui singur scor de test. 
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„13.2. INTERPRETAREA SCORURILOR LA TESTELE DE 
CUNOŞTINŢE INFORMATIVE | 


„Să considerăm, de exemplu, un test de cunoştinţe realizat şi administrat 
de un profesor pentru o clasă, compus din 50 de itemi care conţin câte un 
exerciţiu de calcul aritmetic. Pentru fiecare exerciţiu rezolvat corect se acordă 
un punct, iar cota brută la test a unei persoane este dată de suma cotelor itemilor, 
deci de numărul de exerciţii rezolvate corect. 

Pentru a interpreta rezultatul unui elev, profesorul poate proceda în 
două moduri: | 

e să calculeze procentul de itemi rezolvati corect de elev din totalul 

itemilor testului; 

e să compare cota brută a elevului cu scorurile celorlalte persoane, 

pentru a vedea dacă elevul respectiv a obţinut un rezultat dintre cele 

mai bune, unul mediocru sau unul dintre cele mai slabe. 

Prima metodă este utilă doar în cazul testelor de cunoştinţe cu criterii 
absolute, când procentul de rezolvări corecte arată cât de aproape se află fiecare 
elev de performanţa minimă necesară. De exemplu, dacă se consideră că pentru 
promovarea clasei întâi elevii trebuie să fie în stare să rezolve corect cel puţin 
45 de exerciţii din test, atunci performanța minimă necesară este de 
45/50*100%=90%, iar un elev care a rezolvat corect doar 20 de exerciţii, adică 
20/50*100%=40%, se află cu mult sub nivelul necesar promovării. 

Trebuie menționat, însă, că fixarea şi utilizarea criteriilor absolute 
pentru a se lua decizii importante asupra celor examinati (de exemplu, 
promovarea clasei) impune o verificare foarte atentă a testului din punctul de 
vedere al validității, fidelității şi adecvării la lotul de subiecţi, ceea ce nu se prea 
întâmplă în cazul testelor de cunoştinţe informative. | 

Cota brută a unui elev la un test de cunoştinţe elaborat de profesor 
aduce mai multe informaţii asupra individului respectiv dacă este comparată cu 
rezultatele altor persoane din aceeaşi clasă. Interpretând scorul unui elev prin 
raportare la poziţia sa în cadrul clasei se elimină erorile generate de neadecvarea 
testului la nivelul de cunoştinţe al elevilor examinati (un test prea dificil pentru 
o clasă furnizează doar scoruri mici, astfel încât cel mai bun rezultat obţinut 
poate fi situat sub ceea ce profesorul consideră că ar fi "nivelul minim necesar 
de performanţă”); 
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13.3. INTERPRETAREA SCORURILOR LA TESTELE 
CENTRATE PE CRITERIU 


Aceste teste folosesc, pentru interpretarea scorurilor, un criteriu de 
performanţă fixat înainte de utilizarea lor şi care este independent de rezultatele 
pe care le obţin la test diverse populaţii. 

Stabilirea criteriului se face de către grupul de specialişti care a elaborat 
testul, ţinând cont de comportamentele aşteptate din partea. persoanelor 
examinate şi de nivelul la care este necesar să se situeze rezultatele, pentru un 
individ sau pentru un grup de persoane. | | 

De exemplu, în cazul unor teste de cunoştinţe, criteriile pot fi de 
următoarea formă: "Elevul trebuie să traducă cel putin 80% din cuvintele - 
cuprinse în test." sau "90% din grup trebuie să rezolve corect cel puţin 6 
probleme din 10." i 

Utilizarea testelor centrate pe criteriu în programele instructiv-educative 
are ca principal scop clasificarea elevilor pe. "niveluri" de stăpânire a 
cunoştinţelor, pentru. fiecare din obiectivele urmărite de test (Swaminathan, 
Hambleton, Algina, 1974). Pe baza rezultatelor obţinute la test se decide dacă 
elevul poate trece la programul de instruire următor ori rămâne la programul 
actual, temporar sau un timp nedefinit. | 

Deci, pentru un test centrat pe criteriu sunt fixate de către specialişti 
două sau mai multe categorii ordonate, iar scorurile obţinute la test servesc la 
repartizarea subiecţilor în aceste categorii. Problema care trebuie rezolvată în 
acest caz constă în definirea categoriilor. + e 

Să considerăm un test centrat pe criteriu, având m scoruri posibile: 
57SS7S;..<S,,, Se intenţionează ca acesta să fie folosit la clasificarea subiecţilor 
în k categorii ordonate (2<k<m), prima categorie corespunzând celor mai mici 
scoruri, iar ultima, celor mai mari. 

Definirea categoriilor se face prin fixarea a k+1 praguri: 

lo Sl pigale (13.3.1) 
care realizează o împărțire a intervalului [s b Sm] în k intervale disjuncte. Pentru 
ca orice scor de test să îşi poată găsi locul într-o categorie, se impun următoarele 
condiții: 

e primul prag să fie mai mic decât cel mai mic scor posibil, iar următorul prag 
să fie mai mare decât acest scor: i 


[9 <S St l (13:32) 
e ultimul prag să coincidă cu cel mai mare scor posibil: 
p= S., (13.3.3) 


În cea de-a j-a categorie (j=1,2,...,4) vor fi repartizate toate persoanele 
al căror scor aparţine intervalului (5.p4]. 
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Pragurile fo, t),..., 4 pot fi fixate de specialişti sau pot fi determinate 
astfel încât clasificarea definită cu ajutorul lor să semene cât mai mult cu o 
clasificare existentă, în acelaşi număr de clase, realizată de specialişti. Pentru - 
cea de-a doua variantă, se poate utiliza următorul algoritm: 


(1) Se administrează testul unei populaţii repartizate deja în k categorii. 
De exemplu, în cazul 4=2, prima categorie poate cuprinde persoane apreciate de 
specialişti ca având un nivel de cunoştinţe "nesatisfăcător", iar a doua categorie, 
persoane cu un nivel "satisfăcător" al cunoştinţelor. 


(2) Pentru fiecare posibilitate de fixare a pragurilor Loy În ys. Care 
îndeplineşte condiţiile (13.3.1), (13.3.2) şi (13.3.3):.- | 

e Se face clasificarea persoanelor, pe baza scorurilor obţinute la test, 
astfel: un individ care are scorul x€(¢,,,t;] este repartizat în categoria j, 
jal Ze gre. | 

e Se calculează coeficientul lui Cohen, K (a se vedea Anexa I), care 
evaluează concordanța dintre clasificarea existentă şi cea 
corespunzătoare pragurilor to, ¢,,..., t} Coeficientul K ia valori între -1 
şi +1, fiind cu atât mai apropiat de +1, cu cât cele două clasificări se 
aseamănă mai mult între ele. Pentru fiecare alegere a pragurilor fp, ¢),..., 
t, se obţine o altă valoare a coeficientului K. 


(3) Se aleg drept margini ale celor categorii pragurile to tp... & pentru 
care coeficientul K este maxim. Acestea realizează o clasificare care se 
aseamănă cel mai mult posibil cu cea existentă deja în populaţie. 


În cazul în care testul împarte persoanele examinate în două clase (k=2), 
pragul £, se numeşte nivel acceptabil de performanţă (Guilbert, 1987). Se 
consideră că un subiect îndeplineşte cerinţele criteriului dacă a realizat un scor 


A 


mai mare decât ¢). 

În literatura de specialitate există mai multe păreri privind modul de 
stabilire a nivelului acceptabil de performanță. Se poate aplica algoritmul descris 
mai sus sau se poate alege drept barem pragul ¢, pentru care frecvența relativă 
a persoanelor repartizate în aceeaşi categorie în ambele clasificări, pg, este 


maximă (Crehan, 1974). Pentru calculul frecvenţei pọ se utilizează formula: 


k 
a Ni 
_ i=] 


idl ae 


(13.3.4) 
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unde: l 

n; | = numărul de persoane aflate în categoria i şi repartizate pe baza 
scorului obţinut la test tot în categoria i, =1,2,...,k; 

N = numărul total de persoane cărora li s-a administrat testul. 


13.4. INTERPRETAREA SCORURILOR LA TESTELE 
N ORMATIVE 


-13.4.1. Normele testelor 


În cazul testelor normative, interpretarea scorurilor individuale se 
realizează cu ajutorul unor scări valorice, denumite norme, formate î în cadrul ` 
operaţiei de etalonare a testului. 

Prin etalonare se înţelege stabilirea unei scări care să permită 
determinarea locului ocupat de rezultatele unui subiect faţă de rezultatele unei 
populaţii de referinţă, suficient de numeroasă, formată din Phat comparabile 
cu cea examinată. 

Obiectivul principal al etalonării îl constituie eat dil ea EA iei: de 
frecvenţe a scorurilor testului într-un eşantion extras din această populaţie. 

Normele testului descriu performanţa realizată de eşantionul de 
indivizi ales. Ele sunt valori ale unei anumite car acteristici a repartifiei scorur ilor 
în eşantion. Caracteristica urmărită poate fi: 

e frecvenţa scones mai mici sau mai mari decât o valoare data 
sau 

e valoarea care împarte şirul scorurilor ordonate în două inter vale ale 

căror frecvenţe sunt într-un raport fixat | 
sau l ` 

e media scorurilor. 


Cu ajutorul normelor se determină modul în care se transformă cotele 
brute ale testului în cote uşor de interpretat, numite cote transformate. Acestea 
permit compararea rezultatelor între persoane diferite sau, pentru aceeaşi 
Pele VAD între teste diferite. 

` Pentru a fi cu adevărat utile, normele trebuie să fie descrise detaliat în 
manualul testului, indicând: | 

a. compoziţia populaţiei pentru care au fost stabilite; 

b. modul de formare a eşantionului din această populaţie; 

c. numărul persoanelor din eşantion; 
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d. caracteristicile eşantionului: sex, vârstă, rasă, statut socio-economic, 
localizare geografică, nivel de şcolarizare etc. | 
„e. gradul în care egantionul ales este reprezentativ pentru populaţia 

specificată; | K] d 

f. natura şi uniformitatea condiţiilor în care a fost administrat testul; 

g. data testării. Ria ' 

Tabelele de norme incluse în manualele testelor cuprind în paralel 
cotele brute şi cotele transformate corespunzătoare, pentru una sau mai multe 
populaţii. Ele oferă informaţii numai asupra rezultatelor "obişnuite" sau "tipice" 
pentru populaţiile respective. Nu este vorba despre rezultate "ideale", care ar 
trebui egalate. l ; i 

Tabelele de norme ajută să se dea răspuns la următoarele întrebări: 

e Cum este rezultatul la test al unei persoane în comparaţie cu cel al 
altor persoane din aceeaşi populaţie? | 

e Cum este rezultatul unei persoane la un test comparativ cu rezultatul 
la un alt test? i pi a 

e Cum este rezultatul la un test comparativ cu rezultatul aceleiaşi 
persoane, la acelaşi test, administrat cu câtva timp înainte? i M93 

Pentru ca interpretarea unui scor individual să fie corectă trebuie ca 
normele la care se face raportarea acestuia să fie alese în conformitate cu scopul 
testării. De exemplu, subiectul va fi comparat cu un eşantion: provenit din 
populaţia din care el face parte, dacă examinarea psihologică are scop 
diagnostic, sau cu un eşantion extras din populaţia din care ar urma să facă 
parte, dacă testul se foloseşte în cadrul selecţiei profesionale. 


13.4.2. Etalonarea testelor 


Etalonarea este una dintre etapele acţiunii de standardizare a testului, 
Ea se desfăşoară în următorii paşi: | mu 

(1) Se defineşte populaţia pentru care se etalonează testul. 

(2) Se extrage un eşantion din această populaţie. 

(3) Se administrează testul acestui eşantion. 

(4) Se determină formula de obţinere a cotelor transformate din 

scorurile testului. p i 

În continuare vom detalia conținutul celor patru paşi. - 


(1) Când se construieşte un test, este important să se decidă cine sunt persoanele 


care vor fi examinate cu el, ce caracteristici are cel mai mare grup din care vor 
proveni ele. Acesta reprezintă populaţia căreia îi este destinat testul. 
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Definirea populatiei se poate face fie concret, prin enumerarea tuturor 
membrilor ei, fie operational, prin indicarea unui set de reguli care vor permite 
„să se cunoască, pentru orice persoană, dacă aparţine sau nu popùlației. 

De exemplu, populația poate fi formată din "toate persoanele care au 
“vârsta cuprinsă între 14 ani impliniti şi 18 ani netnpliniti, care locuiesc în oraşul 
Bucureşti şi sunt elevi la liceu”. 

Definiţia populaţiei pentru care se face ME eta unui test este foarte 
arbitrară: toţi indivizii sau numai un lot cu acelaşi nivel şcolar sau de aceeaşi 
vârstă, dintr-un oraş, o regiune sau o ţară. 


(2) Din populaţie se va extrage un eşantion de indivizi -numit grup de normare- 
căruia i se va administra testul, pentru a stabili normele. 

Este important ca în eşantionul format testul să se comporte la fel ca în 
întreaga populaţie: să măsoare sau să prezică aceeaşi variabilă, iar repartiţia 
scorurilor la test în eşantion să fie asemănătoare celei care s-ar obţine dacă s-ar 
dispune de scorurile întregii populaţii. 

Pentru aceasta, eşantionul consti trebuie să îndeplinească două 
cerinţe: 

e să fie reprezentativ pentru populaţia din care a fost extras (structura 
sa să fie asemănătoare structurii populaţiei, în pr ivinta zonelor geografice şi a 
mediului de domiciliu, a nivelului socio- -economic, a vârstei şi a altor caracteris- 
tici pe care autorul testului le consideră importante şi care ar putea influenţa 
rezultatele testului); 

e să fie destul de mare, aşa încât rezultatele obţinute la test să reflecte 
repartiţia acestor valori în populaţia din care provine. 

Obţinerea unui eşantion se poate face prin di aleatoare simplă sau 
prin selecţie aleatoare stratificată. ~ 

in primul caz, fiecare membru al populaţiei are şanse egale de a intra în 
componenţa eşantionului. Dacă eşantionul este numeros, atunci în el se vor gasi 
persoane apartinand tuturor zonelor geografice, claselor sociale, nationalitatilor 
prezente în populaţie, cu aceeaşi frecvenţă relativă ca în populaţie, deci eşantio- 
nul va fi reprezentativ pentru populaţie. | 

Atunci când volumul eşantionului este mic, pentru obţinerea unui 
eşantion reprezentativ este necesar să se facă o selecţie aleatoare stratificată. În 
acest scop, se determină variabilele de mediu (sex, vârstă, rasă, clasă socială, 
nivel educaţional etc.) care au o influenţă mare asupra rezultatelor aplicării 
testului. Se face apoi o clasificare a populaţiei după valorile acestor variabile şi 
se stabileşte care trebuie să fie compoziţia eşantionului astfel încât fiecare clasă 
să fie reprezentată în eşantion proporţional cu frecvenţa ei relativă în populaţie. 
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Exemplu. 
Daca populaţia este formată din 100000 de persoane şi se formează 
clase în funcţie de sex şi mediul de domiciliu, conform tabelului următor: 


Clasa Sex Mediu de 
. | domiciliu 
Cl 


barbati 


Frecventa : Frecventa 


relativa 


G2 barbati 
(Ox) femei 
C4 femei 28000 


100000) | roo | 


atunci intr-un egantion compus din 2000 de persoane frecventele claselor vor fi: 


Total: 


Frecventa Frecventa 
relativa 


Din fiecare clasă se extrag, prin selectie aleatoare simplă, persoanele 
care vor intra în componenţa eşantionului. | 

Principala dificultate în cazul selecţiei aleatoare stratificate constă în 
deteminarea variabilelor după care se face împărţirea în clase. Se recomandă 
(Kline, 1993) ca ele să se aleagă dintre variabilele care corelează semnificativ 
cu scorurile testului. Numărul lor nu va fi prea mare, pentru a nu se forma prea 
multe clase, ceea ce ar necesita alcătuirea unui eşantion foarte numeros. În 
general nu se aleg mai mult de patru variabile. Frecvent, variabilele după care 
se face clasificarea sunt sexul, vârsta Şi clasa socială. 

Volumul eşantionului se stabileşte astfel încât din fiecare clasă să se 
extragă cel puţin 300 de persoane (Kline, 1993). Se deduce de aici că populaţiile - 
generale, care sunt eterogene şi din acest motiv necesită utilizarea mai multor 
variabile pentru formarea claselor, impun obţinerea unor eşantioane foarte 
numeroase. Pentru a se face economie de timp şi de bani, adesea se renunţă la 
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stabilirea normelor pentru o populaţie generală şi se utilizează populaţii mai 
puţin numeroase şi mai omogene, pentru care eşantioanele pot fi de volum mai 
redus. În acest fel se obţin norme locale ale testului. | 

Dacă se constată că un subgrup al eşantionului, care poate fi identificat 
printr-o valoare a unei variabile de mediu (de exemplu "femei" sau "persoane 
„din mediul urban") realizează la test scoruri mult mai mari sau mult mai mici 
decât restul eşantionului, se vor determina norme ale subgrupului şi acestea vor 
fi folosite în practică atunci când persoanele al căror scor trebuie interpretat au 
aceeaşi valoare a variabilei de mediu ca şi subgrupul. 


(3) Dacă eşantionul are un volum foarte mare ori este format din 
persoane care domiciliază sau lucrează în locuri diferite, testul nu poate fi 
administrat deodată tuturor indivizilor. Examinarea cu ajutorul testului se va 
face pe subgrupe. Dar, pentru ca rezultatele să nu fie distorsionate, condiţiile de 
administrare trebuie să fie identice pentru toate subgrupele. 

(4) În urma analizei scorurilor realizate la test de persoanele din 
eşantion se stabilesc normele testului. Apoi se determină modul în care se obţin 
cotele transformate din cotele brute. În acest scop se folosesc mai frecvent două 
tipuri de transformări: l 

e transformari liniare, care schimbă doar media şi abaterea standard a 
rezultatelor, păstrând nemodificată repartiția cotelor, deci ordinea indivizilor din 
eşantion. Prin astfel de transformări se obțin cotele standard z si cotele 
standardizate; Bue | | | 

e /ransformări neliniare, sau transformări de arie, care schimbă 
repartiţia cotelor brute, făcând-o să semene cu repartiţia uniformă (în cazul 
centilelor, decilelor sau al cuartilelor) ori cu cea normală (în cazul când se 
urmăreşte obţinerea unei scale normalizate cu 5, 7 sau 9 trepte). Acest fel de 
transformări schimbă unitatea scalei, astfel încât frecvenţa relativă. a cotelor 
brute care ocupă un interval de valori particular va fi egală cu aria suprafeţei 
cuprinsă între intervalul transformat, desenat pe axa absciselor, şi: 

e curba repartitiei uniforme, pentru rangurile centile, decile şi cuartile 
sau Di AL 

e curba repartitiei normale, pentru clasele scării normalizate. 

Cotele transformate rezultate prin transformări liniare sau neliniare 
indică poziţia relativă a subiectului într-o populaţie. 

Un alt tip de transformări utilizate în etalonare sunt cele care conduc la 
clase echivalente sau la vârste echivalente. Ele se aplică pentru teste care 
măsoară variabile fiziologice sau psihologice ale căror valori cresc cu vârsta (de 
exemplu înălţimea, greutatea, bogăţia vocabularului, performanţa la citire etc.). 
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Aceste cote transformate descriu performanta subiectului sub forma indicarii 
unei populaţii a cărei mediană sau medie a cotelor brute este aproximativ egală 
cu cota brută a persoanei respective. Unele teste de inteligenţă utilizează pentru 
interpretarea scorurilor, în locul vârstelor echivalente, normele de vârstă mintală. 


N 


13.4.3. Clasele echivalente 


Aceste cote transformate sunt folosite frecvent pentru testele de 
cunoştinţe standardizate, destinate claselor primare. 

Tabelele cu clasele echivalente conţin, pentru fiecare lună de şcoală a 
fiecărei clase, mediana cotelor brute la test. Clasa echivalentă este exprimată 
printr-un număr zecimal: partea întreagă reprezintă clasa, iar cifra zecimală, luna 
de şcoală. Se face presupunerea că în cele două luni de vacanţă de vară cotele 
la test ale elevilor nu se modifică. _ 

Pentru interpretarea rezultatului obţinut de un subiect se caută în tabelul 
de norme clasa echivalentă corespunzătoare cotei brute respective. 

Exemplu. | 

În tabelul 13.4.3.1. sunt notate clasele echivalente pentru un test de 
aritmetică ale cărui cote brute iau valori între 0 şi 100, destinat elevilor din 
clasele a II-a, a HI-a şi a IV-a. 


„ Tabelul 13.4.3.1 | 
Clasele echivalente pentru un test de aritmetică 


Clasa Cota Clasa Cota Clasa | Cota 
brută J` brută brută 
2.0 15 3.0 25 PPY A 55 
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Un elev care în prima săptămână de şcoală din clasa a IV-a a obtinut la 
test o cotă brută egală cu 27 are clasa echivalentă 3.1, deci este rămas în urmă 
la aritmetică cu aproape un an. 


Popularitatea utilizării claselor echivalente este dată de faptul că 
furnizează cote transformate uşor de înţeles şi permite compararea rezultatelor 
obţinute la mai multe teste. 


Exemplu. 
Un copil, care este în a doua lună de şcoală din clasa a patra, a obţinut 
la trei teste următoarele clase echivalente: ; 

Limba română : 4.5 | 

Aritmetică : 3.0 

Istorie : 5.4 
Analizând aceste rézultate, părinţii şi profesorii vor intelege că performanţele 
la Limba română sunt apropiate de cele ale celorlalţi elevi în această perioadă 
a anului şcolar, în timp ce scorul de la testul de Aritmetică denotă o rămânere 
în urmă de peste un an, iar cel de la testul de Istorie indică o depăşire a 
cunoştinţelor cu peste un an. 


Trebuie subliniat că valoarea cotei brute indicată în tabelul de norme 
„pentru fiecare clasă echivalentă nu reprezintă o performanţă care este necesar 
să fie atinsă. Ea este doar un rezultat tipic al unui grup de elevi cu acelaşi nivel 
de şcolarizare. Aproximativ 50% dintre persoanele grupului respectiv au 
rezultate mai bune şi aproximativ 50% au rezultate mai slabe decât acestă cotă. 

Principala deficiență a claselor echivalente constă în faptul că aceleiaşi 
"distanţe" între clase echivalente îi pot corespunde distanţe diferite între cotele 
brute ale testului. De exemplu, în tabelul 13.4.3.1, unei diferenţe de un an îi 
corespunde o distanţă de 10 puncte, dacă se compară clasele echivalente 2.0 şi 
3.0, sau de 30 de puncte, dacă se compară clasele echivalente 3.0 şi 4.0. Deci, 
informaţia "Elevul este în urmă cu un an la aritmetică” are semnificaţie diferită, 
în funcţie de momentul în care este emisă. | 

Explicaţia constă în faptul că dezvoltarea intelectuală şi acumularea de 
cunoştinţe sunt procese care nu au o evoluţie liniară în timp. În perioadele 
şcolare în care acumularea de cunoştinţe este masivă, unei diferenţe mici de 
clase echivalente (una sau două luni şcolare) îi corespunde o diferenţă mare de 
cote brute la test. In plus, curba dezvoltării intelectuale relative la vârstă diferă 
de la o persoană la alta. | 

Din aceste motive se recomandă să se folosească transformarea cotelor 
brute în clase echivalente numai pentru aritmetică, citire şi compunere şi doar 
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în perioada claselor primare, când procesul de instruire este asemănător în toate 
şcolile. 

Un procedeu care poate fi aplicat pentru obţinerea tabelelor cu clase 
echivalente este următorul (Flanagan, 1955): | | 

(1) Se administrează testul, în acelaşi timp, unor loturi mari de elevi din 
clase consecutive, deci cu "distanță" de o clasă echivalentă între ele. <— 

(2) Pentru fiecare clasă se determină mediana cotelor brute. 

(3) Se interpolează punctele consecutive (clasă, mediană), fie liniar, fie 
printr-o funcţie crescătoare. 
| (4) Pentru fiecare clasă echivalentă aflată între clasele pentru care s-a 
determinat mediana, din lună în lună, se citeşte de pe graficul ‘funcției 
interpolatoare cota brută a testului şi se rotunjeşte la cel mai apropiat întreg. 

Este important ca loturile de elevi utilizate la stabilirea claselor 
echivalente să fie numeroase şi să conţină persoane cu niveluri şcolare diferite 
(atât avansați, cât şi retardati). 


13.4.4. Vârstele echivalente 


Aceste cote transformate indică, pentru fiecare vârstă cronologică 
exprimată sub forma unei perechi de numere (an, lună), mediana sau media 
(după preferința celui care a făcut etalonarea) cotelor brute la test. Ele sunt 
folosite mai ales pentru teste de inteligenţă (tabelele de norme conţin "vârsta 
mintală” echivalentă) şi pentru teste de cunoştinţe (tabelele de norme conţin 
"vârsta la aritmetică" sau "vârsta la citire” etc.). La fel ca şi clasele echivalente, 
aceste cote transformate sunt potrivite pentru nivelul şcolar elementar, când 
dezvoltarea mintală şi influenţa educaţiei sunt continue şi nu oscilează. 

Vârstele echivalente au aceleaşi avantaje şi deficienţe ca şi clasele 
echivalente. | | 


13.4.5. Normele de vârstă mintală 


Conceptul de vârstă mintală a fost introdus în scalele Binet-Simon 
revizuite în anul 1908. Acestea grupează itemii pe niveluri de vârstă: itemii care 
sunt rezolvati corect de majoritatea copiilor de 7 ani din eşantionul utilizat la 
etalonare sunt plasați la nivelul vârstei de 7 ani ş.a.m.d. Scorul unui copil la 
acest test corespunde celui mai înalt nivel pe care l-a rezolvat cu succes. De 
pildă, dacă un copil de 10 ani (vârsta cronologică) rezolvă corect itemii aflaţi la 
nivelul vârstei de 12 ani, se va spune că are vârsta mintală de 12 ani. 
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Trebuie menţionat că o unitate de vârstă mintală (un an mintal) nu are 
aceeaşi semnificaţie la orice vârstă cronologică. Datorită faptului că dezvoltarea 
intelectuală este rapidă la vârste fragede şi îşi încetineşte ritmul la maturitate, 
- importanţa unei diferente de un an mintâl scade cu vârsta. O diferenţă de un an 
mintal la vârsta cronologică de 3-4 ani înseamnă tot atât de mult ca o diferenţă 
de 3 ani mintali la vârsta cronologică de 9-12 ani (Anastasi, 1954). 

Pentru a putea interpreta mai uşor rezultatele testelor de inteli genta, fara 
a mai face referire de fiecare dată la vârsta cronologică, s-a definit coeficientul 
„de inteligenţă (1Q = Intelligence Quotient). Acesta este egal cu raportul dintre 
vârsta mintală şi vârsta cronologică, multiplicat cu 100. Deci, o valoare de 100 
„a acestui coeficient indică egalitatea vârstei mintale cu vârsta cronologică. 

Coeficientul de inteligenţă permite compararea persoanelor de vârste 
diferite în privinţa dezvoltării intelectuale. Dar, el nu poate fi utilizat pentru 
orice test de inteligenţă destinat adulţilor. La un test ca Stanford-Binet, de 
exemplu, media scorurilor obţinute de persoane de aceeaşi vârstă cronologică, 
mai mare de 15 ani, nu creşte semnificativ de la un an la altul, Deci, indiferent 
de vârsta lor cronologică, adulţii care nu sunt debili mintal vor obţine la test, în 
general, vârsta mintală de 15 ani. Numărătorul coeficientului de inteligență fiind 
acelaşi (egal cu 15), valoarea raportului prin care se calculează acesta va 
depinde doar de vârsta cronologică, mai precis va descreşte cu vârsta. 


13.4.6. Cotele standard z şi cotele standardizate 


Aceste cote transformate servesc la indicarea poziţiei unei persoane faţă 
de o anumită populaţie. | 

O cotă standard z arată cu câte unităţi de abatere standard se 
distanțează cota brută la test a unui subiect de media cotelor brute în populaţia 
cu care se face comparatia. | 

Cotele z se calculează pe baza cotelor brute ale testului, folosind 
formula: 


z= o— | (13.4.6.1) 


unde: 

z = cota z corespunzătoare scorului la test x; 
m, 0 = media şi abaterea standard pentru cotele brute la test în eşantionul folosit 
la etalonare. 
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Cotele standard se folosesc pentru a compara performantele unui 
individ la două sau mai multe teste, dacă mediile şi dispersiile scorurilor 
acestora âu fost calculate pe baza aceluiaşi eşantion de persoane. 

De exemplu, dacă un elev are cotele z la un test de aritmetică şi la unul 
de limba română egale cu 1.8, respectiv cu 0.3, se poate aprecia că elevul este 
mai bine pregătit la aritmetică decât la limba română, chiar dacă el a obţinut 
aceeaşi cotă brută la ambele teste. 

Cotele standard sunt uşor de inter ăn atunci când cotele brute ale 
testului sunt repartizate aproximativ normal în populaţia care a servit la 
etalonare. În acest caz, în intervalul [-1,+1] se află cotele z pentru 68% dintre 
persoane. Despre un subiect care are o cotă standard z=0.72 se poate afirma că 
a obţinut un rezultat "obişnuit", în timp ce o persoană cu o cotă z egală cu 3.6 
are un scor "neobişnuit de mare" (mai putin de 0.13% dintre cei testati cu ocazia 
etalonării au mai realizat un asemenea scor). 

Cotele standardizate au aceleaşi proprietăţi ca şi cotele Aa daia A 
singura diferență între ele fiind valoarea mediei şi cea a abaterii standard (a se 
„vedea Anexa II). 


13.4.7. Rangurile centile, decile şi cuartile 


Rangul centil arată câte persoane s-ar afla în urma unui anumit subiect, 
dacă acesta ar face parte dintr-un grup cu 100 de indivizi. De exemplu, dacă 
85% din cei testati obţin scoruri mai mici decît 60 şi 15% realizează scoruri mai 
mari, atunci scorul 60 va avea rangul centil 85. 
Prezentam în continuare, pe un exemplu, paşii algoritmului de 
determinare a rangurilor centile, prelucrând rezultatele obţinute la un test de un 
eşantion format din 200 de persoane. 


(1) Se ordonează crescător cotele brute ale testului (x) şi se notează 
pentru fiecare valoare numărul de persoane care au realizat scorul respectiv (N). 
Se obţine tabelul 13.4.7.1. 


Tabelul 13.4.7.1 
Frecventele cotelor brute la test 
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(2) Se trasează poligonul frecvenţelor cumulate (Figura 13.4.7.1), 
. procedind astfel: i i 


e În jurul fiecărei valori de scor x, ;=1,2,...,n, se construieşte intervalul 
[x,-0.5, x;+0.5]. 

© Se calculează valoarea fiecărei ordonate y,,  i=1,2,...,1, 
corespunzătoare abscisei x-0.5, făcând raportul dintre numărul 
persoanelor care au scor mai mic decît x; şi numărul total de persoane 
în eşantion şi apoi înmulţind cu 100. 

e Se calculează valoarea fiecărei ordonate y,,, i=1,2,...,n, 
corespunzătoare abscisei x;+0.5, făcând raportul dintre numărul 
persoanelor care au scor mai mic sau egal cu x, şi numărul total de 
persoane în eşantion şi apoi inmultind cu 100. Se observă că y,, este 
egal cu Yas- A 

e Se unesc, pe rând, punctele (x,-0.5, y,.), (cr+0.5,y1..), (370.5, Y2), 
(0.5, Yh), prin segmente de dreaptă. 

e In exemplul nostru n=10. Valorile x, y; şi Yn, =1,2,...,10, sunt notate 
în tabelul 13.4.7.2. 


Tabelul 13.4.7.2 
Valorile x, y; şi yp utilizate la trasarea 
poligonului frecvenţelor cumulate 


R 


Frecventa 
cumulata 


100 
90 
60 
40 


20 


g 
10 11 12 13 14 15 16 17 18 19 20 24 22 23 | Scor 


Figura 13.4.7.1 
Poligonul frecventelor cumulate 


(3) Pentru a determina rangul centil corespunzător unui scor dat, x, se 
citeşte de pe grafic ordonata punctului care are abscisa x. De exemplu, pentru 
scorul x 214: Lk 

14, y=25, y,,=40. 
Rangul centil este valoarea y care corespunde scorului x=14 în ecuaţia dreptei 
ce trece prin punctele 
(0.5, y,) şi (x;+0.5, y; ): 
ero 09 6 41345 


40-25 .14.5-13.5 


y= 15y- 1175 
Deci, scorul 14 are rangul 15*14-177.5 = 32.5. 
Obişnuit, rangul centil se rotunjeste la cel mai apropiat întreg. 


sau 


(4) Pentru a determina scorul care corespunde unui rang centil dat, v, 
se citeşte de pe grafic abscisa punctului care are ordonata y. 

De exemplu, rangului centil 30 îi corespunde pe grafic un punct situat 
pe dreapta care trece prin punctele (13.5 , 25) şi (13.5 , 40). 
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Aloe dreaptă are ecuaţia (13.4.7.2). Dând lui y valoarea 30 se obţine: x = (30 
+ 177,5) / 15 = 13.83 
Deci rangul centil 30 cofesplunde scorului 13.83. 


Normele unui test pot fi prezentate sub forma unui tabel care să conțină 
centilele, adică valorile scorurilor care au rangurile centile egale cu 1, 2, ..., 100, 
sau sub forma graficului poligonului frecvențelor cumulate. Acest grafic poate 
fi realizat fie în modul descris mai sus, fie unind prin segmente de dreaptă 
punctele (x; y;); dacă, însă, grupul testat a fost putin numeros, aceste puncte pot 
fi dispuse destul de neregulat si de aceea se recomandă construirea unei curbe 
netede care să le aproximeze. Având poligonul frecvențelor cumulate, se poate 
determina atât scorul corespunzător unui anumit rang centil, cât şi rangul centil 
al unui scor dat. ay 4 


Unii autori (Lindvall, 1967) recomandă ca în tabelul de norme să se 
treacă pentru fiecare cotă brută a testului, în locul rangului centil, "banda 
centila" care corespunde intervalului de încredere al scorului real. Pentru: 
aceasta, după trasarea poligonului frecvenţelor Gs pentru fiecare scor 
posibil la test, x, se procedează astfel: 

(1) se determină intervalul de încredere al scorului rea (x): 

(2) se citesc de pe graficul poligonului frecvenţelor cumulate ordonatele 
corespunzătoare absciselor x. şi x,, y. şi, respectiv, y.; 

(3) în tabelul de norme, în iza) cotei brute x se notează banda centilă 
OY). 


Tabelul 13.4.7.3 conţine un fragment dintr-un. tabel cu benzi centile. 


Tabelul 13.4.7.3 
„Exemplu de tabel cu benzi centile 


Intervalul de Banda centilă 
încredere pentru 
scorul real 


“14, 16] 
14, 17] 
[16, 18] 
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Normele centile prezintă deficienţe în cazul când scorurile testului sunt 
repartizate aproximativ normal sau când există valori de scoruri care apar cu 
frecvenţe foarte mari. 


Să considerăm, de exemplu, cazul când scorurile au o repartiție de 
frecvenţe normală, prezentat în figura 13.4.7.2. Notăm cu f densitatea de 
repartiție a legii normale. | 

Pentru oricare două valori de scor, x/<x», aria suprafeţei delimitată de 
punctele i 

(X7,0), 2,0), Ax), EAE) i 
este proporțională cu frecvența relativă, în întregul eşantion, a persoanelor care 
au obţinut scoruri cuprinse în intervalul (x,,x,}. 

Cele două porţiuni haşurate de sub curba legii normale, în figura 
13.4.7.2, au arii aproximativ egale. Deci, scorurilor cuprinse în intervalul (a,b] 
le va corespunde un interval al rangurilor centile având aproximativ aceeaşi 
lungime ca şi intervalul determinat de rangurile centile ale scorurilor cuprinse - 
în intervalul (c,d]. Dar, intervalul de valori al scorurilor din prima zonă este de 
4 ori mai mic decît cel al scorurilor din porţiunea a doua: 

d-c = 4 (b-a) 


Figura 13.4.7.2 
Două suprafeţe cu arii egâle pentru o repartiție normală 
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Înseamnă că două ranguri centile consecutive vor corespunde unor 
valori de scor foarte apropiate, deci unor persoane foarte asemănătoare -în 
privinţa variabilei măsurate de test-, în primul caz, şi unor scoruri mai 
îndepărtate, deci unor indivizi destul de deosebiți unul de altul, în cel de-al 
doilea. | 

Atunci când repartiţia scorurilor testului este uniformă, deci fiecare cotă 
brută apare cu aceeaşi frecvenţă, unor intervale egale ca lungime pentru cotele 
brute le corespund intervale de lungimi egale pentru rangurile centile. 

Folosirea rangurilor centile îşi găseşte justificarea numai atunci când 
testul are un număr mare de scoruri posibile. În caz contrar, este de preferat 
rangul decil sau rangul cuartil. Acestea se obţin într-un mod asemănător 
rangurilor centile, doar că aria cuprinsă între axa absciselor şi curba de repartiție 
a scorurilor nu se mai imparte în 100 de parti egale, ci în 10, pentru decile, sau 
în 4, pentru cuartile. Centilele care au rangurile 10, 20,..., 90 coincid cu decilele, 
iar centilele cu rangurile 25, 50 şi 75 sunt egale cu cuartilele. 


13.4.8. Clasele scării normalizate 


La fel ca şi rangurile centile, decile şi cuartile, clasele scării normalizate 
se obţin prin transformări de arie. Diferă doar curba de repartiție utilizată: în 
primul caz este repartiţia uniformă, în cel de-al doilea, cea normală. 

Procedeul de lucru pentru obţinerea scărilor normalizate cu 5, 7 şi, 
respectiv, 9 clabe este asemănător. În toate cele trei cazuri se foloseşte curba de 
repartiție a legii normale cu media zero şi cu abaterea standard o. Axa reală se 
decupează în 5, 7 sau, respectiv, în 9 intervale, dispuse câte două simetric față 
de origine, în felul următor: 

e primul şi ultimul interval au lungime ‘neliniiata, 

e celelalte intervale au lungime finită, egală cu o, în primul caz, cu 

0.660 în cel de-al doilea caz şi cu 0.50 în cel de-al treilea caz; 

e intervalul central conţine în mijloc originea axei. 

Pe baza tabelelor legii normale se determină, pentru fiecare clasă, aria 
suprafeţei cuprinsă între intervalul corespunzător clasei şi curba densităţii de 
repartiție a legii normale. Aceasta va indica frecvenţa relativă a scorurilor pe 
care le va conţine clasa (Figura 13.4.8:1). 
| Valorile găsite, exprimate procentual, sunt următoarele : 

e pentru 5 clase: 7%, 24%, 38%, 24%, 7%; 
e pentru 7 clase: 5%, 11%, 21%, 26%, 21%, 11%, 5%; 
e pentru 9 clase: 4%, 7%, 12%, 17%, 20%, 17%, 12%, 7%, 4%. 
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Figura. 13.4.8.1 | 
Impărțirea suprafeţei cuprinsă sub curba densităţii de 
repartiție a legii normale în cinci clase. 


Concret, în cazul scării normalizate cu 5 clase, considerâhd scorurile 
ordonate crescător: | | 

e prima clasă va conţine primele 7% din scoruri, cele mai mici; 

e a doua clasă va conţine următoarele 24% din scoruri Ş.a.m.d. 

Pe baza procentelor se determină, pentru fiecare clasă, limitele 
intervalului de valori al scorurilor: 
a. Prima clasă va avea limita inferioară egală cu cel mai mic scor 
posibil. | | 
b. Ultima clasă va'avea limita superioară egală cu scorul cel mai mare | 
posibil. 

c. Celelalte limite vor fi calculate tinind cont de valorile scorurilor 


cuprinse în fiecare clasă. Se poate proceda astfel : 


(1) Se desenează poligonul frecvenţelor cumulate ale scoruri- 

lor. i 

(2) Se determină punctele graficului corespunzătoare 

frecvențelor cumulate ale claselor (7%, 31%, 69%, 93% şi 
„100% pentru scara normalizata cu 5 clase). 

(3) Se citesc de pe abscisă valorile scorurilor pentru aceste 

puncte; ele vor fi limitele intervalelor. 


Zoi 


Rezultatele etalonarii vor fi prezentate sub forma unui tabel, in care 
pentru fiecare clasă vor fi indicate limitele intervalului de valori al scorurilor. 
Prin transformările descrise, scorurile obţinute la test de către eşantionul 
selecționat vor primi valori din A E 
{1, Zu Ch, 
c reprezentînd numărul de clase (c=5 sau ay, sau c=9). Scorurile transformate 
vor avea o repartiție aproximativ normală. 


Prezentăm algoritmul de transformare a scorurilor în 5 clase: 
= normalizate, folosind datele din exemplul precedent: 


(1) Notăm într-un tabel frecvențele cotelor brute ale testului (Tabelul 
13.4.8.1). 


Tabelul 13.4.8.1 
Frecventele absolute şi cumulate ale scorurilor testului: 


Frecventa 
cumulata, 
in 
procente 


-(2) Reprezentăm grafic frecvențele cumulate, interpoland liniar intre 
punctele (x,y) consecutive (Figura ri 4.8. 2) 
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Frecventa 
cumulata 
CA și 


"hae i 
10 11 12 13 14 15 16 17 18 19 20 21 22 23 


Figura 13.4.82 
Determinarea intervalelor scorurilor la transformarea în cinci clase 
normalizate i 


(3) Prima clasă trebuie să cuprindă 7% din persoane. Punctul de pe 
grafic care are ordonata egală cu 7 se găseşte pe dreapta care trece prin punctele 
(10, 5) şi (11, 15). Ecuația acestei drepte este | 


y=5_ x-10 


1-5 NO 


sau i 
Y=10x-95 - 
Pentru y=7 se obţine x=10.2. Prima clasă va avea limita inferioară egală 
cu cea mai mică valoare posibilă de scor şi limita superioară egală cu 10.2. 


(4) Primele două clase trebuie să cuprindă 7%+24%=3 1% din totalul 
persoanelor. Punctul de pe grafic care are ordonata egală cu 31 se află pe 
dreapta care trece prin punctele (12, 25) şi (14, 40). Această dreaptă are | 
ecuaţia : i 


isd, dy ole 
40-25 14-12 
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sau 
y=7.5x-65 

Pentru y=31 se obtine x=12.8. Deci a doua ole va conţine intervalul (10. Py 

12.8]. 


(5) În acelaşi mod vom găsi intervalele pentru celelalte clase (Tabelul 
13.4.8.2). 


Tabelul 13.4.8.2 
Intervalele de scoruri pentru fiecare clasă normalizată 


clasa interval: 


< O2 
(10.2, 12.8] 
(12.8, 16.5] 
(16.5, 21.6] 
Pe DA 


| (6) Utilizand tabelul 13.4.8.2 se determină clasa normalizată care 
corespunde fiecărei cote brute (Tabelul 13.4.8.3). 


Tabelul 13.4.8.3 
Corespondenta cotă brută - clasă normalizată 


Prin această transformare se schimbă forma repartitiei scorurilor 
(Figura 13.4.8.3). 


clasa 
norma- 
lizată ~ 
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Frecventa | Frecventa 
relativa (7) relativa (7) 


„48 


20 


0 | 9 
19 11 12 13 14 15 16 17 18 19 20 21 22 23 Scor. l 2 345 Scop 
vechi nou 


Figura 13.4.8.3 | 
Schimbarea formei repartitiei scorurilor prin transformarea în cinci clase 
normalizate . | | | 


Există şi cazuri când o transformare în clase normalizate nu are sens. De 
exemplu, atunci cînd frecvenţa relativă a primului scor este mai mare decît 11% 
este imposibil de stabilit limitele claselor 1 şi 2 pentru o transformare normali- 
zata în 9 clase. ` 


13.5. INTERPRETAREA SCORURILOR LA 
CHESTIONARELE DE PERSONALITATE 


13.5.1. Descrierea procedeului obişnuit 


Interpretarea scorurilor obţinute de un subiect la majoritatea chestiona- 
relor de personalitate are la bază adjective şi propoziţii scurte descriind compor- 
tamente, care sunt grupate în liste ataşate scalelor sau unor grupări de scale. 

Prezentăm câteva exemple referitoare la Inventarul Psihologic Cali- 
fornia (CPI). i 

Pentru fiecare dintre primele 20 de scale din CPI există două asemenea 
liste: una corespunzătoare scorurilor mici şi alta corespunzătoare scorurilor mari. 

„De exemplu, scala So (care evaluează gradul de interiorizare a valorilor 
normative şi culturale) are ataşate următoarele liste (Pitariu, Albu, 1993): 
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Scoruri mici: rebel, nesatisfacut, nonconformist. 
Scoruri mari: constiincios, bine organizat, productiv. 
Pentru unele perechi de scale, cum ar fi 

Re (responsabilitate) şi Cs (capacitate de statut), 

Do (dominanţă) şi Re (responsabilitate), 

Do (dominanta) şi Sy (sociabilitate) 
au fost întocmite câte patru liste, conform următoarei scheme (Megargee, 1972; 
Pitariu, 1985): 


Lista 2: | 
scala 1: scoruri mari 
scala 2: scoruri mari 


Lista 1: 
scala 1: scoruri mici 
scala 2: scoruri mari 


Lista 3: 
scala 1: scoruri mici 
scala 2: scoruri mici 


Lista 4: 
scala 1: scoruri mari 
scala 2: scoruri mici 

Pentru ca o caracterizare întocmită cu ajutorul listelor ataşate scalelor 
să concorde cât mai mult cu situaţia reală trebuie să fie solul gRae corect 
următoarele două probleme: 

e Adjectivele sau propoziţiile conţinute în liste să fie m scalei 

sau grupărilor de scale. 

e Din liste să fie selectate acele TEA sau propoziții care au o 

probabilitate mare de a fi potrivite persoanei testate. 

Algoritmii utilizați pentru rezolvarea acestor probleme în cazul 
chestionarelor de personalitate utilizate în practică nu sunt totdeauna corecti. 
Aşa este, de exemplu, metoda aplicată la formarea listelor ataşate scalelor din 
: CPI (Gough, 1989, 1991; Megargee, 1972). Ea se bazează pe coeficientul de 
corelaţie liniară între scorurile scalelor şi scorurile adjectivelor (scorul unui 
subiect la un adjectiv este egal cu frecvenţa alegerii adjectivului pentru 
caracterizarea persoanei). În lista corespunzătoare scorurilor mari ale unei scale 
sunt introduse adjective care corelează pozitiv semnificativ statistic cu scorurile . 
scalelor, deci care sunt mai potrivite persoanelor care obţin scoruri mari decât 
celor care realizează scoruri mici. Dar, nu există siguranţa că aceste adjective 
sunt într-adevăr potrivite pentru majoritatea celor care au. scoruri mari şi, de 
asemenea, nu se poate şti dacă ele nu sunt valabile pentru un procent însemnat 
din mulţimea subiecţilor cu scoruri mici. 

Faptul că listele sunt ataşate "scorurilor Bai respectiv "scorurilor 
mici", ale scalelor prezintă mai multe dezavantaje si constituie o sursă de erori 
în interpretare. Astfel: 
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a. Prin expresia "scoruri mari (mici)" nu este precizată destul de clar 
valoarea de scor începând de la care (până la care) sunt valabile adjectivele 
listei; unii o consideră egală cu m, alţii cu m+o (m-0), unde m şi o reprezintă 
media şi abaterea standard a scorurilor scalei. | 

b. Nu este posibilă o diferenţiere între subiecţii care au obţinut scoruri 
apropiate ca valoare, dacă acestea sunt considerate "mari" sau "mici". 

c. Nu există asemenea liste pentru interpretarea scorurilor medii ale 
scalelor. | ` 
Pornind de la aceste considerații am proiectat algoritmi (Albu, 1992a 
şi 1994) care rezolvă ambele probleme formulate anterior, utilizând "funcțiile 
caracteristice ale adjectivelor" referitoare la o scală sau la o pereche de scale. 


N 


13.5.2. O metodă de interpretare a scorurilor în cazul unci 

singure scale . 

Se consideră o scală a unui chestionar de personalitate, s, ale cărei 
scoruri pot lua valorile 0,1,...,n, şi un adjectiv (sau o expresie descriptivă) a. 


DEFINIŢIA 13.5.2.1. (Albu, 1992). Prin funcţie caracteristică a adjectivului 
a relativă la scala s se înţelege o funcţie j 

Je: 0; L..-. 7h => [0,1] | 
care ia ca valoare, în orice punct xe {0,1,...,7}, probabilitatea ca adjectivul să fie 
potrivit pentru caracterizarea unei persoane care a obţinut la scala s scorul x. 


Algoritmul de construire a funcţiei caracteristice a adjectivului a 
relativă la scala s se compune din doi paşi: 


Pasul 1: 
Se obţin punctele experimentale. Pentru aceasta se procedează astfel: 
A. Se administrează scala s unui eşantion de subiecţi Z, cât mai 
numeros şi mai eterogen, astfel încât să se obţină cât mai multe valori 
de scor din mulţimea 40,1,...,n). 
B. Aceloraşi persoane li se cere să aprecieze dacă adjectivul a li se 
potriveşte sau nu. 
C. Se notează: 
N = numărul de persoane din lotul experimental, Z; 
S = mulţimea scorurilor x€{0,1,2,...,2} care au fost obţinute la scala s de 
persoanele din lotul Z. 
D. Se defineşte funcţia 


263 


“fS -> [0,1] 


astfel: 
Ax) =m, xes | (13:5.2.1) | 
ne)’ eh PIZ 
unde: * “i | 
n(x) = numărul de subiecţi care au obţinut la scala s scorul x: 
| Mino) = N 
xeS 


m(x) = numărul de persoane, dintre cele care au obţinut scorul x la scala, care 
au considerat că adjectivul a li se potriveşte; 
E. Se reprezintă grafic punctele experimentale (x, f(x)), xeS. 


Pasul 2: | 
„Se construieşte fanctia caracteristică a adjectivului a relativa la scala s: 
Je: {0,1,.+.,72} ->[0,1] 
al carei grafic aproximează Buriâtelă exper cula pi 
Se procedează astfel: 
A. Se determină, din mulţimea TOE clon de. grad cel mult trei, 
funcția- de cea mai bună aproximare, în sensul celor mai mici pătrate, a funcției 
fpe mulţimea S, notată cu P; 
Pe{p:R->R | PEIRES +bx? +ex+d, a,b,c,deR} 
B. Se defineste functia 
Je: {0,1,...52} > [0,1] 
astfel: | 


| { P(x), dacă 0< P(x) <1 
fi) = 11, dacă P(x) >] (13.5.2.2) 
© t0, dacă P(x) <0 


pentru xe (0,1,...,n). | 
C. Se calculează eroarea medie de reprezentare: 


pu E a ACU ea pic (1.3,..5.223Ă 
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DEFINIŢIA 13.5.2.2. Se consideră că adjectivul a este adecvat scalei s, la 
pragul de probabilitate Pye(0,1) fixat şi la pragul de eroare fixat € dacă sunt 
îndeplinite următoarele condiţii: _ 

„e eroarea medie de reprezentare Æ este mai mică decât €; 

e funcţia caracteristică, f îndeplineşte una dintre următoarele condiţii: - 

(C1) f, este nedescrescătoare, adică: | 


byt, SJA). (13.5.2.4) 
(C2) f, este necrescătoare, adică: | 
Sta => JNS) (1315.25) 


(C3) există un punct f€{1,2,...,n-1} astfel încât, oricare ar fi punctele 
IE 40,1,....n), 1=1,2,3,4, care îndeplinesc condiţia, £ şt ŞI Şt şt, are loc una 
dintre următoarele situaţii: | 


Ft) SFAt2) $F. to) Si f(t) 2fAt3)2 A. 4 1613.3-246) 
sau | 

LACIE ACAD EPA CD ES ACE A(D) } (13,5.2.7) 
e funcţia £ are pe mulţimea {0,1,...,72} valori atât mai mari, cât şi mai mici decât 
Po. 


Toate adjectivele care sunt adecvate scalei s se retin pentru a fi utilizate 
la caracterizarea persoanelor. 


Tehnica de selecţie a adjectivelor pentru editarea raportului 
psihologic 


Se consideră un chestionar de personalitate ale cărui scale sunt s,, 
ee a 
Se fixează un prag de probabilitate P,e(0,1) şi un prag, de eroare €. 
Pentru fiecare! scală s, i=1,2,....m, se notează cu A mulţimea 
adjectivelor adecvate scalei s, la pragul de probabilitate Pg şi la pragul de eroare 
5 | 
Pentru o persoană care la scalele chestionarului a obţinut scorurile x, 
X2-0%m (X= scorul la scala s;, i=1,2....,.m) editarea raportului psihologic se poate 
face astfel: 
e la fiecare scală s,, i=1,2,...,m, se determină valoarea funcţiei caracteristice a 
fiecărui adjectiv a din mulţimea A;, în punctul x; f(x); 
® se retin adjectivele pentru care f ,(x,)> Pp. 
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13.5.3. O metoda de interpretare a scorurilor in cazul unei 
perechi de scale - 


Se consideră un adjectiv a A două scale ale unui chestionar de persona- 
litate, s, şi Sz. 
Se notează cu X şi Y mulțimile scorurilor posibile la cele două scale. 


DEFINIŢIA 13.5.3.1. (Albu, 1994). Prin funcţie caracteristică a adjectivului 
a relativă la perechea de scale (s,,s2) înţelegem o funcţie 

Fo: XxY -> [0,1] 
care ia ca valoare, în orice punct (x,y)é XxY, probabilitatea ca adjectivul a sa 
fie potrivit pentru caracterizarea persoanelor care au obţinut scorul x la scala s, 
şi scorul y la scala s 


Se notează: 
N = numărul de persoane în lotul experimental; . 
S c XxY = mulţimea perchilor de scoruri (x,y) obţinute la cele doua scale de 
persoanele din lotul experimental; 
n(x,y) = numărul de subiecţi care au obținut scorul x la scala s, şi scorul y la 
scala s;, (x,y)eS: 


> ny) = N 


(yes 


m(x,y) = numărul de subiecţi, dintre cei care au obţinut scorul x la scala s, şi 
scorul y la scala s;, care au apreciat că adjectivul a i se potriveşte, (x,p)eS. 
Se defineşte funcţia: 
F: S -> [0,1] 
astfel: 


Foy) = e, (xyes ` (13.5.3.1) 


Se determină funcţia de cea mai bună aproximare, în sensul celor mai 
mici pătrate, a funcţiei F, pe mulţimea S, notată cu P: 
P e {p:RxR->R | ÞE AE +bx? tasty +ey +fy+g, a,b,c,d,e,f,geR} 
Se construieşte funcţia caracteristică a adjectivului a: 
F.: XxY -> [0,1] 
astfel: : 
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fi P(x,y), dacă 0< P(x,y) <1 

Eyes daca P(x,y) >1 (13. debug.) 
l LO, dacă P(x,y) <0 

pentru (x,y)eXxY 

şi se calculează eroarea medie de reprezentare, prin formula: 


| A 
E=— nep For -F xy) (13.5.3.3) 
Nes 


DEFINIŢIA 13.5.3.2. Se consideră că adjectivul a este adecvat perechii de 
scale (S1,S2), la pragul de probabilitate Pge(0,1) şi la pragul de eroare fixat €, 
dacă funcția sa caracteristică F., îndeplineşte următoarele condiţii: 

e eroarea medie de reprezentare Æ este mai mică decât € 

e restrictia funcției F, pe orice submulțime a mulțimii XxY formată din puncte 
situate pe aceeaşi dreaptă este sau necrescătoare sau nedescrescătoare sau 
neconcava sau neconvexă; 

e funcția F, are pe mulţimea XxY valori atât mai mari cât şi mai mici decât P,, 


Toate adjectivele adecvate unei perechi de scale vor fi reţinute şi vor fi 
utilizate la descrirea persoanelor. 

Pentru caracterizarea unui individ care a obţinut la o pereche de scale 
scorurile (x,y), vor fi selectate acele adjective ale căror funcţii caracteristice 
satisfac inegalitatea F(x,y)>Po. 


13.5.4. Avantajele celor două metode de interpretare a scorurilor 


a. Metodele prezentate permit să se utilizeze, la` caracterizarea 
persoanelor, nu numai adjective corespunzătoare valorilor extreme ale 
scorurilor scalelor, ci şi adjective care sunt potrivite doar scorurilor medii. De - 
exemplu, pentru scala de flexibilitate Fx din CPI adjectivul "adaptabil" este 
potrivit numai scorurilor medii, la scoruri mari fiind mai potrivit adjectivul 

"instabil". 


b. Ele fac posibilă caracterizarea prin adjective diferite a unor persoane 
care au scoruri apropiate ca valoare la una sau la două scale. 


l c. Pot fi rA pentru editarea rapoartelor psihologice cu ajutorul 
calculatorului. 


4 
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13.5.5: Exemple 


Un lot de 436 femei a răspuns la itemii din CPI. 
S-au ales pragurile Po=0. 85 si e=0.20. 


A. S-au construit funcţiile caracteristice ale pr opoziţiei: 
(p1) "Nu are încredere în forţele proprii” 

relative la doine dintre scalele Do (dominanta) şi In (independenţă) din CPI, 
întrucât această propoziţie este inclusă în listele ataşate celor două scale, pentru ` 
caracterizarea persoanelor care obțin "scoruri mici". 

Valorile statistice ale scorurilor celor două scale sunt : 
e pentru Do: m=18.63  0=5.76 
e pentru In: m=15.37 o=3.74 

In figurile 13.5.5.1 şi 13.5.5.2 sunt reprezentate graficele restricţiilor 
funcţiilor caracteristice ale propoziției p/ relative la aceste scale, pe mulţimea 
scorurilor obţinute de subiecţi. 

S-a putut constata că scorul maxim pentru care propoziţia p/ este 
“potrivită cu o probabilitate mai mare decât P, este mai mic, în ambele cazuri, 
decât m-a: pentru Do acest scor este egal cu 11, iar pentru In, este egal cu 10. 


0123456789 


Figura 13.5.5.1 
Graficul funcției caracteristice a propoziției p/, relativă la scala Do 
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Figura 13.5.5.2 
Graficul functiei caracteristice a propozitiei p/ relativă la scala In 


B. S-au construit funcţiile F„ pentru propoziţiile: 

(p2) Simt o dorinţă puternică de reuşită în viaţă. 

(p3) Mă entuziasmez foarte uşor. 
relative la scalele v1 (introversiune / extraversiune) şi v2 (acceptarea normelor) : 
din CPI. 

Mulțimea S, a perechilor de scoruri obţinute la scalele v1 şi v2 de lotul 
experimental, utilizată pentru construirea funcţiilor F, este inclusă în mulţimea 
[12,30]x[21,33]. Această mulţime a jucat, în exemplul de fata, rolul mulţimii - 
XxY. ; 

Valorile statistice ale scorurilor celor două scale sunt: 


e pentru vl: m;=21.17 0=5.92 
e pentru v2: m,=26.84 0,=4.73 


Graficele funcțiilor caracteristice F, pe mulțimea [12,30]x[21,33] sunt 


prezentate în figurile 13.5.5.3 (pentru propoziţia p2) şi 13.5.5.5 (pentru ` 
propoziția p3). 
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Figur 13.5.5.3 
Graficul functiei car acteristice a propozitiei p2 relativa la perechea de 
scale (v1,v2) yi 
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Figura 13.5.5.4 | | 
Perechile de scoruri (5/,s2) pentru care propoziţia p2 se poate utiliza în 
descrierea persoanei 


270 


Figura 13.5.5.5 
Graficul funcţiei caracteristice a propozitiei p3 relativă la perechea de 
scale (v1,v2) 


= „Ba vieti: 30) + VUREZ1 333 


Figura 13.5.5.6 
Perechile de scoruri (s),5) pentru care propoziţia p3 se poate utiliza in 
descrierea persoanei 
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În figurile 13.5.5.4 şi 13.5.5.6 sunt notate prin cercuri pline (discuri) 
perechile de scoruri (s,s) pentru care valorile funcţiei caracteristice F. sunt mai 
mari decât Py ` 

Considerăm mulțimile formate din perechi de scoruri (s,,s2) (s =scorul 
la scala v1, s=scorul la scala v2), cărora, conform celor arătate în paragraful 
13.541.158 sea al listele 1-4: 


AL = (5/52): Sr <mro, şi S} > mzt+a>} 
A2 = (5/52) : Sa 2 );+0;, şi 52 2 Myt} - 
A3 = {(5),59) : S; < M-00, Şi S3 < M03} 
A4 = {(5),82) : S} 2 mo, Sis) < M-03} 

Se observa că, pentru nici una dintre propozițiile p2 şi p3, suprafața pe 
care funcția caracteristică ia valori mai mari decât P} nu coincide cu vreuna 
dintre mulțimile AINS, A2NS, A3NS, A4nS. Aceasta înseamnă că cele două 
propoziții nu ar trebui incluse în listele ataşate perechii de scale (v1,v2). Dar, ele 
sunt utile pentru caracterizarea persoanelor care au obținut la cele două scale 
scoruri din mulțimile de puncte notate prin cercuri pline în Henrie, 13.5.5.4 si 
133256: , 


CAPITOLUL 14 
PROFILUL PSIHOLOGIC 


Frecvent, atât în cercetările ştiinţifice cât şi în practică, se înregistrează 
valorile pe care le iau două sau mai multe variabile dependente D), D;...., D, 
(n22) pentru diverse valori ale variabilelor independente J,, J,,..., Zm (m21). Se 
ajunge la următoarea problemă: dacă valorile variabilelor independente sunt 
alese astfel încât între oricare două înregistrări cel puţin o variabilă indepen- 
dentă îşi schimbă valoarea, ce se poate spune despre felul în care se modifică, 
de la o înregistrare la alta, ansamblul valorilor variabilelor i SL pui 
probleme atunci când variabilele dependente D, D,..., P îndeplinesc 
următoarele condiţii: 

a. sunt măsurate pe scală de acelaşi tip (de exemplu, pe scală de 

interval); 

b. iau valori în aceeaşi mulţime (de exemplu, pot lua doar valorile în pă 

3,4 şi 5); 

c. fiecare valoare posibilă are aceeaşi semnificaţie pentru toate 

variabilele (de exemplu, dacă variabilele dependente indică prezenţa 

unor atribute, atunci valoarea 0 va însemna “atribut absent", iar 
valoarea 1, "atribut prezent”). | 

În asemenea situaţii se obişnuieşte să se vizualizeze valorile variabilelor ` 
dependente construind câte un di pentru fiecare înregistrare (Tabachnick, 
Fidell, 1989). 

Trasarea unui profil constă în reprezentarea grafică a punctelor cores- 
punzătoare valorilor variabilelor dependente şi unirea punctelor consecutive prin 
segmente de dreaptă. 


Exemple de situaţii în care se pot realiza profiluri 


- A. Într-o cercetare referitoare la folosirea calculatoarelor într-o companie, în 
cursul unei luni, variabilele independente sunt compartimentul companiei şi 
tipul calculatorului, iar variabilele dependente reprezintă timpul mediu de 
utilizare şi timpul mediu de depanare al calculatoarelor. Se poate construi câte 
un profil pentru fiecare pereche (compartiment, tip de calculator). 


B. Un director de instituţie îşi apreciază angajaţii în privinţa pregătirii profesio- 
nale, a constiinciozitatii, a punctualităţii şi a disciplinei. Calificativele acordate 
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sunt numere întregi, cuprinse între 1 şi 5, cu următoarele semnificaţii: 1=foarte 
slab, 2=slab, 3=mediocru, 4=bun, 5=foarte bun. In acest caz, variabila 
independenta corespunde persoanelor din institutie, iar variabilele dependente 
sunt cele patru criterii utilizate la formularea caracterizărilor. Se pot trasa atâtea 
profiluri, câte persoane au fost apreciate. 


C. Pentru a studia eficacitatea unui medicament se fac măsurători ale unui 
anumit parametru fiziologic, în cinci momente (înaintea începerii tratamentului 
şi apoi, de patru ori, din 10 în 10 zile), utilizându-se persoane aflate în diferite 
stadii ale bolii. Variabila independentă are ca valori stadiile bolii, iar variabilele 
dependente corespund celor cinci momente de măsurare. Fiecare profil va 
corespunde unui stadiu al bolii. EI va conţine mediile valorilor parametrului 
fiziologic, în cele cinci momente, calculate pe baza valorilor notate pentru toate 
persoanele aflate în stadiul de boală respectiv. 

În practică se întâlnesc mai frecvent două moduri de trasare a 
profilurilor (Piéron, Pichot ş.a., 1952): 

e Se foloseşte un sistem de axe ortogonale, pe una fiind notate 
variabilele dependente, iar pe cealaltă valorile posibile ale acestora. 

e Se desenează câte o rază pentru fiecare variabilă dependentă. Razele 
au aceeaşi lungime, pornesc dintr-un centru comun şi oricare două raze alăturate 
formează între ele un unghi egal cu 360° /numărul de variabile dependente. Pe 
fiecare rază se marchează printr-un punct valoarea variabilei dependente. 

Ordinea în care sunt notate într-un profil variabilele dependente este 
determinată de semnificaţia acestora. Astfel, dacă variabilele corespund unei 
caracteristici măsurate sau observate în mai multe momente, ordinea lor va fi cea 
cronologică. Dacă variabilele dependente pot fi grupate (de exemplu, unele se 
referă la forma şi mărimea unui produs, altele la costurile de producţie ale 
acestuia), atunci cele care fac parte din aceeaşi grupă vor fi reprezentate alături. 

Noţiunea de profil apare şi în psihologie, mai ales în orientarea şcolară 
şi profesională. Variabilele independente reprezintă persoane sau grupe de — 
subiecţi constituite după diverse criterii (de exemplu, sex, vârstă, profesie, nivel 
de şcolarizare etc.). Variabilele dependente sunt rezultatele unor măsurători (de 
exemplu, timpi de reacţie ori frecvențele relative ale unor tipuri de erori), 
scorurile unor scale sau diferenţele de scor între două administrări ale unui test. 

| Pentru a putea construi profilul psihologic pe baza rezultatelor unor 
teste se obişnuieşte să se transforme cotele brute obţinute de subiecţi la diverse 
scale în cote standardizate, în decile sau stanine. 

Atunci când profilul corespunde unui grup de persoane, valoarea 
fiecărei variabile dependente este media valorilor variabilei respective pentru 
persoanele din grup. 
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Trasarea profilurilor psihologice serveşte in principal următoarelor 
scopuri: | | 
A. compararea între ele a unor grupe de persoane; | 
B. compararea unei persoane cu mai multe grupe, pentru a geterna 
în care grupă ar trebui repartizată; 

C. compararea a două persoane, una cu alta; 

D. compararea unei persoane cu ea însăşi, înainte şi după un anumit 
eveniment (de exemplu, un tratament). 

În continuare, vom prezenta, pe scurt, procedele de lucru pentr u fiecare 
dintre aceste scopuri. 

A. Compararea profilurilor grupelor utilizează metode statistice specifice, care 
fac obiectul "analizei de profil”. Se încearcă să se dea răspuns următoarelor 
întrebări: ay 

a. Cum se asociază variabilele dependente pentru fiecare grup? Ce 
deosebiri există între grupe în această privinţă? 

b. Există vreo variabilă dependentă ale cărei valori medii diferă 
semnificativ între grupe? 

c. Profilurile grupelor sunt paralele între ele? 

Consecința paralelismului profilurilor este faptul că scorurile cele mai 
mici şi scorurile cele mai mari apar la toate grupele pentru aceleaşi variabile. 
Dacă grupele sunt formate din subiecţi supuşi unor tratamente diferite şi 
profilurile sunt paralele, se poate deduce că tratamentele au efecte similare. : 

d. În cazul profilurilor paralele, există diferente de "nivel" între grupe? 

"Nivelul" unui profil este media valorilor . tuturor variabilelor 
dependente. 

B. Determinarea grupei din care face parte o persoană este o problemă de clasa- 
re, care se rezolvă adesea prin compararea persoanei respective cu prototipurile 
claselor şi identificarea prototipului cu care aceasta "seamănă" cel mai mult. 

Atunci când profilurile grupelor sunt diferite, se poate considera fiecare 
"profil ca fiind prototip al grupei. Se determină profilul persoanei, pe. baza 
valorilor variabilelor dependente care au fost utilizate la trasarea profilurilor 
grupelor, şi se compară profilul persoanei cu profilul fiecărei sine 
Exemplu. 

Pentru a afla dacă o persoană are tulburări socio- emoţionale se pot 
utiliza drept variabile dependente scalele chestionarelor STAI şi STAXI. Se. 
compară scorurile obţinute de subiect cu scorurile medii realizate de două loturi: 
unul format din persoane cu tulburări socio-emoţionale şi unul appii din 
persoane fără asemenea tulburări. 

l De obicei, compararea profilului persoanei cu profilul unei i grupe constă 
în calculul distanței dintre punctele 
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i (Pi Payers Pn) şi (21, ED &,); 

unde, pentruj=1,2,...„n: | 

p; este valoarea variabilei dependente D, la persoana respectivă; 
8, este media valorilor variabilei dependente D, în cadrul grupei. 

Pentru calculul distanţei dintre punctele (p,, p»,..., p,) $i (Bj) Boyes Bn) se 
va utiliza una dintre distanţele spaţiului R" (de exemplu, distanţa euclidiană, 
distanţa lui Mahalanobis, distanţa city-block etc.), aleasă în funcţie de impor- 
tanta acordată distanțelor dintre valorile componentelor (a se vedea Anexa II). 

Asemănarea profilurilor este cu atât mai mare, cu cât distanţa dintre 
puncte este mai mică. 

Compararea unui profil individual cu profilul unui grup impune să se 
aibă în vedere şi următoarele aspecte: 

a. Rezultatele ei pi profilurilor depind de funcţia aleasă pentru 
disant ' i 

b..O aceeaşi valoarea distanței poate să apară atunci când între ` 
OUR comparate diferă mult valorile unei singure variabile dependente, 
celelalte variabile având valori egale, sau când toate variabilele dependente 
diferă puţin între profiluri. Sunt importante şi diferenţele mici între valorile 
variabilelor dependente sau acestea ar trebui neglijate? Are sau nu: importanţă 
care este variabila dependentă pentru care apar diferenţe mari între valori? 

c. În funcţiile utilizate pentru calculul distanțelor din spaţiul R” nu au 

importanţă semnele diferenţelor Pr8 (j=1,2,...,) ci doar mărimile lor în valoare 
absolută. Dar, în problemele practice, nu contează şi semnele diferenţelor? De 
exemplu, dacă se face compararea profilurilor pentru a identifica profesia cea 
mai potrivită unei persoane, are importanță dacă în. privinţa unei variabile 
individul respectiv este mai bun sau mai slab decât media grupei ori contează 
doar mărimea diferenţei dintre rezultatul său şi media grupei, în valoare 
absolută? 
C şi D. Pentru a putea întopptera corect diferenţele dintre două profiluri 
individuale, care aparţin la doi subiecţi diferiţi sau aceluiaşi subiect în două 
momente diferite, ar trebui să se poată şti dacă diferenţa valorilor observate la 
fiecare variabilă dependentă ely ine unei deosebiri reale sau este datorată 
întâmplării. 

Prezentăm o metodă de comparare a doua profiluri individuale, care 
porneşte de la ideea că orice scor observat la un test este afectat de erori de 
măsură şi ia în considerare, pentru fiecare variabilă dependentă, scorurile care 
„ar fi putut să apară, cu o anumită probabilitate fixată, în locul celui observat. 

Această metodă este aplicabilă atunci când sunt îndeplinite următoarele condiţii: 
e Variabilele dependente reprezintă scoruri brute la teste care măsoară 
caracteristici durabile. 
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e Pentru fiecare test scorurile posibile aparțin unei mulţimi finite 
formate din numere 
întregi consecutive: 

XA iii unde XEZ six-=x,,+1, i= = viza 

(aceste mulţimi pot să difere de la un test la altul). 

e Fiecare test a fost administrat de două ori aceluiaşi lot de subiecţi 
care, în privinţa variabilelor dependente studiate nu s-au modificat între test şi 
retest. Verificarea acestei condiţii se face urmărind dacă relaţia dintre scorurile 
testului şi cele ale retestului este liniară, semnificativă statistic la un prag p fixat 
(p=0.01 sau p=0.001), şi dacă diferenţa mediilor scorurilor între test si retest 
este nesemnificativă statistic la pragul p. 

Se procedează astfel: 

(1) Se fixează o probabilitate Pe[0, 1]. 

(2) Pentru fiecare test se rezolvă. problema următoare (Albu, Pitariu, 
1995b): să se determine, pentru fiecare scor posibil al testului, xeX, un interval 
care să îl conțină: | 

[u(x,P), v(x,P)], u(x,P)s x <v(x,P), 
astfel încât să fie îndeplinite următoarele condiţii: 


(C1) Probabilitatea ca o persoană care a obţinut la o administrare a testului 
x puncte să realizeze la o altă administrare (anterioară sau posterioară celei la 
care subiectul,a fost cotat cu x puncte) y puncte, ye[u(x,P), v(x,P)], să fie cel 
puţin egală cu P: 
P(ye[u(x,P),v(x,P)] | x) =P | » (14.1) 
Intervalul [w(x,P), v(x,P)] conţine scorurile "cele mai apropiate 
probabilistic" de x. 


(C2) Pentru orice scor posibil xeX, dacă ye[u(x,P),v(x,P)], atunci Si 
x€[u(y,P),v(y,P)] (dacă y este unul dintre scorurile: "cele mai apropiate 
probabilistic" de x, atunci şi x este unul dintre scorurile "cele mai apropiate 
probabilistic" de y); 


(C3) Extremităţile intervalelor [u(x,P),v(x:,P)] să fie cât mai apropiate de x, 
pentru toate scorurile posibile x: 


C(P)=max. max {x-1(x,P),v(x,P)-x} > minim (14.2) 


Trebuie remarcat ca problema determinării intervalelor [u(x,P), v(x,P)], 
pentru xeX, care să respecte condiţiile (C1) şi (C2), are întotdeauna soluţie, căci 
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se poate construi, pentru fiecare scor posibil x, intervalul [(x,P),v(x,P)] punând 
u(x,P)=x, $i v(x, P)=Xp | 

Problema construirii intervalelor [4(x,P),v(x,P)], pentru xeX, care să 
respecte condiţiile (C1), (C2) şi (C3), atunci când testul a fost administrat de 
două ori unui lot de persoane şi fiecare scor posibil a fost obţinut cel putin o - 
dată, poate fi transpusă matematic sub forma unei probleme de programare. 

Se notează: i | 
Ji numărul de subiecţi care au obţinut scorul x la test şi scorul;x la retest, 
TA baal WB 7 datih l | A 

Faptul că fiecare scor posibil a fost obţinut cel puţin o dată (indiferent 
la care dintre administrări) se exprimă prin inegalitatea: 

n 


Ly hd >O, i512, op (14.3) 


J=1 


Introducem variabilele a, j IJ51,2,...,n, Cu următoarea semnificaţie: 
a,;-1 dacă scorul x, aparţine intervalului construit pentru scorul x; şi 
a,j=0 în caz contrar. 
Se cere să se determine numerele Aij 1f=1,2,....4, în următoarele 
condiţii: 
(a) aye{0,1}, iy=1,2,...,7 | (14.4) 
(din construcţia variabilelor a, J) 
(b) al MSIN ak (14.5) 
(fiecare scor posibil x trebuie să facă parte din intervalul "scorurilor 
care sunt cele mai apropiate probabilistic” de el) 


(c) ` Oj Api, ÎL RAR (14.6) 
(condiţia C2 a problemei) 

(d) Ai] S Az S.S Ay Sau | (14.7) 
dii 2 Air 2 whe Gin] 2 Cin (14.8) 


pentru 1=1,2,-34, 
(pentru a avea câte un interval [u(x,P),v(x,P)] în jurul fiecărui scor 


posibil x) 
(e) 
de I Sig de Ube 
P(x) = 4 - Jal HR (14.9) 
PACO 
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pentru i= 1523.,.58 | 
(condiţia C1 a problemei: P(x;) reprezintă frecvenţa relativă a subiec- 
tilor care au obţinut la o administrare a testului scorul x,, iar la cealaltă 
un scor din intervalul construit pentru x, din totalul celor care au 
obţinut la una dintre administrările testului scorul x) 


(f) 
i | 
C(P) = max maxf3° a, ae Fa, => minim (14.10) 
I<isn =i+] TENI 


(condiția C3: prima sumă reprezintă diferența v(x,P)-x, iar a doua, diferenţa 
x-u(x,P), pentru x=x;) 


(3) Pentru fiecare din cele două cazuri în care se trasează profilul, la 
fiecare test, se înlocuieşte scorul obţinut, x, cu intervalul [u(x), v(x)], în care se 
află scorurile care, cu probabilitatea P, ar fi putut să apară în locul scorului x. 
Se înlocuieşte astfel profilul tradiţional, în care pentru fiecare test este desenat 
un punct, corespunzător scorului obţinut de subiect, cu un profil în care pentru 
fiecare test este trasat segmentul corespunzător intervalului în care, cu 
probabilitatea P, s-ar fi putut găsi scorul subiectului. | 

(4) La un test la care valorile în cele două profiluri sunt x şi y se va 
afirma că profilurile diferă numai dacă intervalele corespunzătoare celor două, 
scoruri, [u(x), v(x)] şi [u(y), vO] au intersectia vida. 


Exemplu. 

In figura 14.1 sunt prezentate profilurile psihologice la CPI pentru doua 
persoane. Fiecare profil s-a obţinut prin reprezentarea grafică a cotelor 7 la 
primele 20 de scale din‘CPI. 

Aplicând procedeul descris mai sus, s-a determinat, pentru probabili- 
tatea P=0.85, intervalul în care s-ar fi putut afla scorul brut al fiecărei scale. 
Limitele intervalelor au fost transformate în cote 7. În figura 14.2 sunt 
prezentate profilurile celor două persoane, realizate cu ajutorul intervalelor. Se 
observă că pentru unele scale (Do, In, Sc, Gi, Wb, Ac) intervalele celor două 
profiluri au porţiuni comune, deci este posibil ca la scalele respective persoanele 
să nu se deosebească una de alta. 


279 


suosad enop nyuəd ‘J 10[2709 [nloynfe no əjezuozosdal 149 El soISOJOYIsd aanpizorq 
B TPI vansiy 


l . əurossəd 
enop nyuad *S8:0=d HiLeujqeqosd əozezundsaio 10Ja[eA19u! ponfe no ayeyuazoidal “149 ej 92130[oyisd apunjryoig 


THT VANS 


w 


OLTA E 


a he 


i 
| 
E 
S 


LET maane. cca 


| CAPITOLUL 15 
O ABORDARE A TEORIEI TESTELOR PSIHOLOGICE 
BAZATĂ PE TEORIA CLASIFICÂRII 


Înțelegerea acestui capitol necesită parcurgerea prealabilă a Anexei I. 


15.1. TESTUL PSIHOLOGIC CA INSTRUMENT DE 
CLASIFICARE ft oe 


Utilizarea în practică a testelor psihologice revine la rezolvarea unor 
probleme de clasificare. De exemplu: 

A. Ordonarea persoanelor pe baza scorurilor obţinute la un ‘test 
înseamnă formarea unui clasament în mulţimea subiecţilor. 

B. Alegerea, dintr-o mulţime de candidaţi examinati cu mai multe probe. 
psihologice, a celui mai potrivit pentru un anumit post impune clasarea - 
candidaţilor în una din clasele disjuncte "admis" şi "respins", urmată de 
ierarhizarea celor admişi pe baza rezultatelor la probele psihologice. 

C. Selecţia sau orientarea profesională se realizează conform unui 
algoritm compus din următorii paşi: 


(1) Se stabilesc clasele în care se va face clasarea candidaţilor. O clasă 
corespunde unui post sau unei grupe de posturi asemănătoare prin cerinţe. 


(2) Se determină variabilele, fizice sau/şi psihice, care permit o 
diferenţiere între posturile pentru care se face selecţia. De exemplu, pentru un 
post poate fi necesară rezistenţa fizică, iar pentru altul, o atenţie distributivă 
bună. 


(3) Se aleg instrumentele care măsoară aceste variabile şi permit 
diferențieri între clase, în sensul că valorile lor diferă de la o clasă la alta. 


(4) Pentru fiecare clasă se descrie un prototip, folosind valori posibile 
sau ideale ale măsurătorilor făcute cu instrumentele alese. 


(5) Fiecare persoană examinată cu instrumentele alese este comparată 


cu toate prototipurile. Ea va fi clasată în clasa prototipului cu care se aseamănă 
cel mai mult. 
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15.2. CONSTRUIREA TESTELOR PSIHOLOGICE 


Calculul scorurilor unui test prin insumarea, ponderata sau nu, a 
scorurilor itemilor componenti, reprezintă un procedeu de agregare a unor 
clasamente: | 

e Fiecare item, prin scorurile sale, defineşte o relaţie de preordine totală 
în mulţimea E a subiecţilor. 

e Scorul testului, la rândul său, defineşte o relaţie de preordine totală 
pe aceeaşi mulţime E şi, deci, conduce la un clasament. 

Construirea unui test psihologic urmăreşte să selecteze, dintr-o mulțime 
dată de itemi, un număr (fixat a priori sau nu) de itemi şi să stabilească un 
procedeu de agregare a clasamentelor (concret, de calcul al scorului testului) 
astfel încât clasamentul rezultat, corespunzător scorurilor testului, să fie cât mai 
asemănător cu un anumit clasament existent, cunoscut sau nu. Clasamentul 
existent este dat de scorurile unui criteriu sau de valorile unei variabile latente. 
În cel de-al doilea caz, clasamentul nu este cunoscut. Adesea se presupune că 
el coincide cu clasamentul realizat de scorurile factoriale ale subiecţilor pentru 
un factor comun itemilor. 

Vom explica în continuare ideile care stau la baza procedeelor de 
construire a testelor. 

Se consideră o mulţime de persoane, E, şi doi itemi de test. Pentru 
fiecare persoană care a răspuns la ambii itemi se calculează un "scor total", LR 
folosind formula: 

5, = wjspoh was, = iE | (15.2.1). 
unde: IP 
Sı, S2 Sunt scorurile persoanei la cei doi itemi; 

W), W2 sunt ponderi (numere reale pozitive) constante pentru toate persoanele. 
Scorul total calculat astfel realizează un clasament în mulțimea E. 
Procedeele statistice aplicate pentru construirea testelor psihologice au 

la bază următoarele teoreme: 


TEOREMA 15.2.1. Dacă cele două clasamente corespunzătoare itemilor 
coincid, atunci clasamentul corespunzător scorului total coincide cu ele. 


TEOREMA 15.2.2. Atunci când clasamentul corespunzător primului item este 
o rafinare a clasamentului corespunzător celui de-al doilea item, clasamentul 
corespunzător scorului total coincide cu clasamentul corespunzător primului 
item. é 
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TEOREMA 15.2.3. Dacă cele două clasamente corespunzătoare itemilor 
coincid cu un clasament dat, atunci ele coincid între ele. 


TEOREMA 15.2.4. Atunci când clasamentul corespunzător primului item 
coincide cu clasamentul corespunzător celui de-al doilea item, care este o 
rafinare a unui clasament dat, clasamentul corespunzător primului item este şi 
el o rafinare a clasamentului dat. 


„Aceste teoreme se aplică succesiv, luând în locul celor doi itemi, testul 
existent la un moment dat şi un item din mulţimea celor care pot fi adăugaţi 
testului. | | 
În practica psihologică, însă, se întâlnesc foarte rar clasamente care să 
coincidă sau unul să fie o rafinare a altuia. Intervin diverse erori de măsură care 
au drept consecinţă faptul că persoane care obţin acelaşi scor la un item (şi, deci, 
aparţin aceleiaşi clase in partitia ordonată corespunzătoare itemului) obţin 
scoruri diferite la un alt item (făcând parte din clase diferite in partitia ordonată 
corespunzătoare acestuia). Din acest motiv nu se mai caută clasamente astfel 
încât unul să fie o rafinare a altuia sau să coincidă cu el, ci clasamente care să 
"concorde" între ele. Concret, ce se înţelege prin "concordanţă", diferă de la o 
metodă statistică la alta. Dar, în esenţă, concordanța a două clasamente se referă 
la apropierea lor de situaţia când ele coincid (dacă relaţiile de preordine totală 
cărora le corespund clasamentele au acelaşi număr de clase de echivalență) sau 
când unul este o rafinare a celuilalt (dacă numărul de clase de gorana ale 


relațiilor de preordine totală diferă). 


În cadrul analizei de itemi, al metodelor de construire a testelor şi al 
cercetării validității relative la criteriu se folosesc diverse formule pentru 
evaluarea concordantei a două clasamente. 

Astfel, studiul validității relative la criteriu a testelor Şi al validității. 
itemilor compara clasamentul corespunzator unui criteriu cu cel corespunzator 
testului sau itemului cu ajutorul unui coeficient de corelatie (corelatie liniara, 
corelaţie biserială sau: corelatia rangurilor). 

În cercetarea puterii de discriminare a itemilor, clasificarea 
corespunzătoare criteriului se reduce la trei clase, din care, pentru verificarea 
concordantei clasamentelor se folosesc doar cele două extreme ("contrastante"). 
Itemul are putere de discriminare dacă scorurile sale realizează un clasament 
concordant cu cel dat de clasele contrastante. 

Eliminarea itemilor al căror indice de dificultate este egal sau aproxi- 
mativ egal cu 0 sau cu 1 are ca explicaţie faptul că un clasament în care toate 
persoanele ocupă acelaşi loc nu poate să concorde cu nici un clasament în care 
există mai multe locuri. 
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Construirea unui test care să aibă o validitate bună relativ la un criteriu, 
prin selectarea acelor itemi care au o validitate bună faţă de criteriul respectiv, 
este de asemenea o aplicaţie a teoremelor 15.2.1 si 15.2.3, în care termenul 
"coincid" a fost înlocuit cu termenul "concorda". Astfel: atunci când clasamen- 
tele corespunzătoare celor doi itemi concordă cu clasamentul corespunzător 
criteriului, clasamentele lor concordă între ele, va concorda şi cu clasamentul 
corespunzător scorului total care, la rândul său, va concorda cu clasamentul 
corespunzător criteriului. | 

Importanţa introducerii în test doar a itemilor valizi rezultă din 
următorul exemplu. 

Exemplu. 

Să considerăm 10 persoane, S}, 52..->510, pentru care se cunosc valorile | 
unui criteriu. Să presupunem că scorurile criteriului verifică inegalitatile: 

c(sp) < c(S2) <... <c(5) | FETS 2425 

Se doreşte să se construiască un test care să fie valid faţă de acest 
criteriu. | 

Se porneşte de la o colecţie iniţială formată din 6 itemi dihotomici, i), 
i>,...,15 Scorurile obţinute de subiecţi la aceşti itemi şi la testul compus din ei 
sunt notate în Tabelul 15.2.1. 


Tabelul 15.2.1 
Scorurile itemilor i}, î>,...;ig pentru 
subiecţii 5), 5>,...,5 


Analizand scorurile itemilor si ale testului se deduc urmatoarele: 

e Pentru primii trei itemi partitiile ordonate corespunzatoare scorurilor ’ 
lor sunt rafinate de partitia ordonată corespunzatoare scorurilor criteriului. Daca 
un subiect s, este inferior altui subiect s; la criteriu, c(s;)<c(s;), atunci s; nu obţine 
la item un scor mai mare decât s; (ije {1,2,...,10}). 


285 


e Itemii i; sii, produc clasamente "inverse": daca s-ar schimba modul 
lor de cotare (s-ar da 1 punct în loc de 0 puncte şi invers), ar rezulta clasamente 
pentru care clasamentul bazat pe valorile variabilei criteriu ar fi o rafinare. 

e Itemul i, este necorespunzător: obţin scorul | la item persoanele care 
au rezultate medii la criteriu şi, prin urmare, clasamentul produs de el nu 
coincide şi nu este rafinat de clasamentul produs de criteriu. 

e Testul format din cei şase itemi produce o ierarhie foarte diferită de 
cea bazată pe variabila criteriu. De exemplu, scorul maxim la test îl are subiectul 
s, care nu se află printre cei cu valorile cele mai mari ale criteriului. 

Dar, ţinând cont de rezultatele analizei validității itemilor, se poate 
construi un test care să nu modifice prea mult ordinea subiecţilor. Pentru aceasta 
se schimbă modul de cotare pentru itemii i; şi i, (scor nou := l- scor vechi) şi se 
renunţă la itemul i,. Scorurile noi ale itemilor şi scorul total al testului sunt 
prezentate în tabelul 15.2.2. 


ind _ Tabelul 15.2.2 | 
Scorurile noi ale itemilor şi scorul testului pentru 
| subiecţii Sps 52509510 


În teoria răspunsului la itemi se consideră că un item dihotomic este 
valid dacă are curba caracteristică (curba de regresie) crescătoare fata de 
variabila măsurată de test. Alura curbei de regresie constituie, deci, o metodă de 
verificare a concordantei între clasamentul corespunzător scorurilor itemului şi 
cel corespunzător valorilor variabilei măsurate de itemi (acest al doilea clasa- 
ment nu este cunoscut). | | l 

Si atunci când testul se construieşte utilizând teoria răspunsului la itemi, 
obținerea unui clasament corect al subiecților este condiționată de alegerea 
itemilor valizi. 
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Exemplu (Albu, 1993). 

Consideram un test alcatuit din trei itemi dihotomici, care măsoară 
aceeaşi trăsătură psihică şi ale căror funcţii caracteristice au expresia analitică: 
| l-c 


Ay): șes Tro bay E1 5.2.3) 


Parametrii funcțiilor caracteristice sunt : 


al b,=6 c;=0 
a;=-0.1 b=1 5 c30 
az=1 byll c;=0 


Funcţia caracteristică a celui de-al doilea item este descrescătoare 
(a,<0), deci itemul nu este valid. 

La fiecare nivel al variabilei măsurate, reR, sunt posibile, teoretic, toate 
scorurile testului. Luând în considerare probabilitățile scorurilor, există în 
fiecare punct feR o repartiție de probabilitate de următoarea forma: 


0 | 2 3 


POPO PAO PD (15.2.4) 


cu P(t) 2 0, i=0,1,2,3 
şi POP (O+PANtP(O=1. 


Valorile PD, P„(0, P(t) şi P;(0) se pot calcula cu ajutorul funcţiilor 
caracteristice ale itemilor. 

Notăm cu 4 (t evenimentul ca itemul / să fie cotat cu un punct pentru 
o persoană având nivelul variabilei măsurate egal cu 7, pentru i=1,2,3. 
Probabilitatea evenimentului Af) este egală cu valoarea în punctul ¢ a funcţiei 
caracteristice a itemului, p(9). 
Acceptăm ipotezele obişnuite din teoria răspunsului la itemi (Lord, 
1980): nt 

e variabila măsurată ia valori pe întreaga axă reală; 

e în fiecare punct /eR, evenimentele 440, i=1,2,3, sunt In PSM 
probabilistic intre ele. 
| În acest caz se pot scrie formule de calcul pentru probabilitățile P,, 

i=0,1,2,3. Acestea sunt (pentru simplificarea scrierii renunţăm la notarea 

„argumentului 2): 
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PU -p)C0-p2)0-ps) 

PFpAl-pXl-p3) + -p))p(1-p3) + (1-p))(1-p2)p3 
P(1-p)pps + PAl-pps + ppX1-p3) 

PP PP3 


S-a studiat testul format din cei trei itemi cu ajutorul funcţiei care ia ca 

valoare, în fiecare punct teR, scorul cel mai probabil la test, Small): 

Sho >R-> {0,1,2,3} 
Sma(t)= max {j | P()=max {P,()|i=0,1,2,3}} 
(Smalt) este scorul de test care are cea mai mare probabilitate în punctul ¢; daca 
exista mai multe valori pentru care probabilitatea este egala cu cea maxima, 
atunci S,,.(¢) este cea mai mare dintre ele.) 

Graficul funcţiei S, este prezentat in figura 15.2.1. După cum se 
observă, scorul cel mai probabil al testului nu mai este nedescrescător fata de 
caracteristica măsurată de test. Persoanele pentru care scorul cel mai probabil 
este scorul maxim (S,,.=3) sunt cele cu un nivel mediu al variabilei măsurate de 
test. | | 


Figura 15.2.1 
Graficul funcţiei Spa 


Din exemplele prezentate se deduce că, pentru a obţine un test care să 
realizeze un clasament al subiecţilor concordant cu cel dat de un criteriu sau de 
o variabilă latentă este necesar să se analizeze validitatea itemilor şi să se reţină 
în test doar itemi valizi. O Te A ri : 

Metoda analizei factoriale construieşte un test psihologic selectând 
itemii cu saturatii mari într-un acelaşi factor, adică itemii care corelează liniar 
semnificativ cu un acelaşi factor. O altă metodă de construire a testelor reţine în 
test doar itemii care corelează liniar semnificativ unii cu alţii. Ideea care stă la 
baza acestor procedee este că există o variabilă latentă ale cărei valori produc 
un clasament cu care trebuie să concorde clasamentul corespunzător scorurilor 
testului. În primul caz, se face presupunerea că factorul comun itemilor produce 
un clasament concordant celui dat de variabila latentă. În cel de-al doilea caz, 
nu se ştie nimic despre clasamentul produs de variabila latentă dar se presupune 
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„că toţi itemii ale căror clasamente sunt concordante între ele produc clasamente 
concordante cu cel al variabilei latente. 


15.3. VALIDITATEA UNUI TEST 
15.3.1. Validitatea relativă la construct 


Aprecierea validității unui test se bazează pe corectitudinea interpretă- 
rilor date scorurilor testului şi a concluziilor desprinse din acestea. În majori- 
tatea cazurilor, pentru interpretarea rezultatelor unei testări se compară scorurile 
fiecărei persoane examinate cu scorurile altor persoane. Comparatia înseamnă 
să se identifice care dintre relaţiile >, = sau < este prezentă între două scoruri. 

Pentru a se putea face inferenţe corecte despre persoane, plecând de la 
rezultatele unui test, este necesar ca relaţiile >, = sau < existente între scorur ile 
testului să reflecte corect relaţia existentă între valorile variabilei măsurate de 
test. S-a folosit aici expresia "să reflecte corect" în locul expresiei "să fie 
identică" deoarece, după cum se va arăta în continuare, identitatea relaţiilor nu 
este, în general, posibilă. Relaţiile dintre scorurile testului "reflectă corect" 
relaţiile dintre valorile variabilei măsurate de test dacă ierarhia subiecţilor 
constituită pe baza scorurilor testului aproximează bine (într-un sens care va fi 
precizat în continuare) ierarhia existentă între aceste persoane în privinţa 
variabilei respective. 

Notăm: 

A = mulţimea persoanelor examinate cu un test; 

X = mulţimea scorurilor posibile ale testului: 

X SUX jp Ho A CU XS Xz See S Xa 

t(a) = scorul la test pentru persoana acA; 

(A). (r(a)laeA } 

Presupunem că mulțimile A şi X sunt PE: 

Definim în mulţimea A trei relaţii, astfel: 

a>b <=> t(a)>t(b), a,beA 

„a=b <=> t(a)=t(b),a,beA | 

azb <=> a>zb sau a=rb, a,beA 

Relaţia =; este o relaţie de echivalență, iar relaţia = este o relaţie de 
preordine totală. Prin relaţia >, testul realizează un clasament al persoanelor 
examinate. 

În teoria răspunsului la itemi se consideră că variabila psihică măsurată 
de test poate lua orice valoare reală între -œ şi +, | 
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Notam : 

a) = valoarea variabilei psihice măsurate de test, pentru persoana 

acA; 

ES {Oa)|aeA} 

Întrucât valorile a), acA, sunt numere reale, elementele mulţimii 
EA) pot fi comparate cu ajutorul relaţiilor >, > şi = existente în R: În mulţimea 
A vom defini trei relaţii binare astfel: . 

a>sb <=> Qa) Xb), abea >» 

a=b <=> &a)=Qb), a,beA 

a>sb <=> a>sb sau a=sb, a,beA 

Relatia =, este o relatie de cel eliant iar relaţia 3 este o relaţie de 
preordine totală. 

Deci, în mulţimea A avem două CT unul produs de relaţia >, 
şi unul produs de relaţia >s. 

Întrucât variabila psihică poate lua orice ‘valoare reală, în timp ce 
mulțimea scorurilor posibile ale testului, X, este finită, în mod obişnuit numărul 
claselor de echivalență ale relației de preordine totală > este mai mare decât cel 
al claselor de echivalență în relația de preordine totală >y. 

Considerăm că un test care are funcția de măsurare a unei variabile 
psihice este un instrument de măsură valid dacă îndeplineşte următoarele două 
condiții: ' j ii 

a. oricare două persoane care au aceeaşi valoare a variabilei psihice 
măsurate obţin la test acelaşi rezultat: 

a=b => a= b 

b. orice persoana poate fi superioara alteia la test numai dacă îi este 

superioară şi în privinţa variabilei criteriu: 
A>7b => a>gb 
Aceste condiţii conduc la următoarea formulare: 


DEFINIŢIA 15.3.1.1. Un test este valid pentru mulţimea de persoane A atunci 
când clasamentele corespunzătoare relaţiilor de preordine totală >. şi > coincid 
sau clasamentul corespunzător relaţiei > este o rafinare a clasamentului 
corespunzător relaţiei >+. 

Înseamnă că în cazul unui test valid în sensul acestei defi niţii oricare 
două persoane care au aceeaşi valoare pentru variabila psihică măsurată vor avea 
rezultate egale la test. Deci se poate construi o funcţie 

F:R->X 

F(©) = rezultatul obținut la test de toate persoanele care au valoarea O 

pentru variabila psihică, 
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care are următoarea proprietate: 

0>0, > F(O)2F(O) 

In realitate, însă, cu excepţia testelor care au un singur rezultat posibil, 
ceea ce face să nu prezinte interes practic, nu se poate construi niciodată o 
asemenea funcţie. Deci nici un test pentru care numărul scorurilor posibile este 
mai mare decât 1 nu satisface condiţiile definiţiei 15.3.1.1. Aceasta, deoarece 
nici un test nu realizează o măsurare perfectă: din cauza a numeroşi factori care 
intervin (condiţiile de administrare şi de cotare, starea de oboseală sau boală a 
celor examinati, hazardul etc.) pentru o valoare a variabilei psihice măsurate © 
se pot obţine mai multe rezultate de test. Mai exact, pentru fiecare valoare reală 
© există o repartiție de probabilitate a scorurilor testului: 


n 


P (8) iP (Od), P (8) 


Xi Xa see x | 2 
(15.3.1.1) 


cu 0<P(@)<1, i=1,2....,n 
si PKO+P O+... +P O=, 
unde PQ) reprezintă probabilitatea scorului x, i=1,2,...,7 ! 
Vom încerca să redefinim validitatea testului utilizînd funcția care are 
ca valoare, în fiecare punct GeR, scorul cel mai probabil la test, Smal O). 
Sma 2 R -> X 
Sak 9)>. max {xEX|P(O)= max{P({ OW= 1,2490) } €45,3.1.2) 


(Sia 9) este valoarea de test care are cea mai mare probabilitate în punctul ©, 
dacă există mai multe valori pentru care probabilitatea este egală cu cea 
maximă, atunci S,,,(@) este cea mai mare dintre ele.) 
Considerăm că un test este un instrument de măsură bun numai dapi 
îndeplineşte următoarele condiții: 
(C1) două persoane care au aceeasi valoare a variabilei psihice au şanse mari 
să obțină acelaşi rezultat la test; 
(C2) există şanse mari ca dintre două persoane diferite în privința variabilei 
psihice, cea care are o valoare mai mare a acestei variabile să realizeze la test un 
rezultat cel putin la fel de bun ca si cealaltă persoană. 
Se observa ca, daca sunt indeplinite conditiile: 
e pentru fiecare valoare OER: 
e mulţimea {x,eX|P(O)=max{P()]i=1,2,...,2}} conţine un 
singur element şi 
probabilitatea rezultatului x, PA 6), este mult mai mare decât 
probabilitățile celorlalte scoruri de test în punctul 6; 
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e funcţia S, este nedescrescătoare: p 

0> 0, Ti Smal 0) Smal) a, (15.3.1.3) 
atunci sunt verificate conditiile (C1) si (C2) de mai sus. 

- Atunci când în fiecare punct GeR există un singur scor cu probabilitate ~ 
mare, iar această probabilitate este mult mai mare decât probabilitățile celorlalte 
scoruri, funcţia S, este apropiată de funcţia Sea Care ia ca valoare, în fiecare 
punct GeR scorul mediu al testului: 

Sia: R -> [XXn]. 


| n oF re 
Srnec?) p3 xP (0) (15.3.1.4) 
= 

Pentru măsurarea distanţei dintre funcţiile Spa $i Sna se poate folosi 
norma Spaţiului L;: 


sabo el | Snax (E) - Saca (E de (15.3.1.5) 


Cu ajutorul functiei Su putem defini trei relaţii binare în mukimea A: 
a>pb <=> Smal Ka) Sine Xb)), a,beA 
a=pb <=> ran Xa) = Sal Xb)), a,beA 
azpb <=> a>pb saua=pb, a,beA 
| Relaţia =p este o relaţie de echivalență, iar relaţia d este o relaţie de 
preordine totală. — 
Daca este îndeplinită condiţia (15. 3.1.3) atunci au loc implicatiile: 
a=b <=> Ha)=Kb) => a=pb 
a> pb <=> Spal KAP Snel AP) => Ka)> Kb) <=> a> h 


Se deduce ca, daca este. îndeplinită condiţia (15.3.1.3) atunci 
clasamentul corespunzător relaţiei >, coincide cu clasamentul corarpunaater 
relaţiei >p sau este o rafinare a acestuia. 


DEFINIŢIA 15.3.1.2. Va spune că un test este P-valid pentru mulţimea 
persoanelor examinate A atunci când clasamentele corespunzătoare relaţiilor de 
preordine totală >, şi >p coincid sau clasamentul corespunzător relaţiei 2. este 
o rafinare a clasamentului corespunzător relaţiei 2p. | 

Condiţia de P-validitate este mai slabă decât condiţia de validitate 
formulată prin definiţia 15.3.1.1. Dacă un test este valid, atunci pentru orice 
valoare GER există un singur scor de test cu probabilitatea diferită de zero, care 
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corespunde valorii funcţiei F în punctul @ deci funcţia Sp coincide cu funcţia 
F şi este verificată condiţia (15.3.1.3), adică testul este P-valid. Dar nu orice test 
P-valid este valid. | 

Se pune, în mod firesc, întrebarea: cum se poate construi un test P- 
valid? Având o mulţime de itemi M, ale căror funcţii caracteristice pp i=1,2,....n, 
sunt cunoscute, care itemi ar trebui aleşi din M pentru a rezulta un test P-valid? 

Se fac următoarele convenţii, obişnuite în teoria răspunsului la itemi: 

a. toţi itemii testului măsoară aceeaşi variabilă psihică; 

b. la orice valoare GER fixată, modul de rezolvare a unui item este 
independent de modul de rezolvare a celorlalţi itemi ai testului. 

Au fost determinate următoarele condiţii referitoare la funcţiile 
caracteristice ale itemilor, care asigură obţinerea unui test P-valid. 


TEOREMA 15.3.1.1. (Albu, Pitariu, 1991a). Dacă funcţiile p, i=1,...,n sunt 

derivabile şi nedescrescătoare pe R, p{-~)=0, p{+-)=1 pentru i=1,2,...,7 atunci 

există k+1 puncte (0<k<n-l): 
ab Sta Cl Ss. <ly < too 

astfel încât: | 


0, 9<4 
i» Ocli 


in, Oeft,,t,) 
S a AO ly ane (15.3.1.6) 


ip, REl) 
T 024, 
cu 0 <i, <iz<...Si<n. 
Deci, în aceste condiţii, funcția S,,,, este o funcție în scară, nedescres- 
cătoare. Lungimile "treptelor" scării (adică a segmentelor care corespund câte 
unei valori de scor) sunt determinate tot de funcțiile p, Prezentăm, în acest sens, 


următoarea teoremă. 


TEOREMA 185.3.1.2. (Albu, Pitariu, 1992a). Dacă funcţiile p, i=1,2,...,.7, sunt 
continue pe R si dacă există punctele 


i I,min i Da s VA ȘINE < Toris Sæ S iniaa < Tek 
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astfel incat | 
=0, Qe(-c,7,  ] 


„min 


p(9) e(0, 1), de(7, i,min? limda 
=], Oe[T, 


i, max? + ©) 


pentru :=1,2,...,n, fiecare funcţie p; fiind crescătoare pe intervalul. (T; mins Tima)» 


atunci există n puncte t; € (T; min Tima)» > 1,23... cu proprietatea că 


0,  0<, 
Snax) = k, Belt, t,,)s k=1,2,...,2-1 
n, 024, 


Punctele t, sunt soluțiile ecuațiilor pi(0) = 0.5 pentru i=1,2,...,n 


Condiţiile impuse de teorema 15.3.1.2 asupra funcţiilor p, şi graficul 
funcţiei Sa corespunzătoare sunt ilustrate în figura 15.3.1.1. 

Pentru un test ai cărui itemi satisfac ipotezele teoremei 15.3.1.2 are ise 
egalitatea: 


F Mpman 
Sag Seal 7 =] Oe J (1-py@)at 
k,min h 


(153.1.7) 


Această cantitate este reprezentată de suma ariilor suprafeţelor Eosunate 
din Figura 15.3.1.1. 

Pentru minimizarea valorii ||Spm-Smed| se vor alege itemi ale căror 
funcții caracteristice au intervale A Tmax] cu vient mici. 


Un test ai cărui itemi satisfac ipotezele teoremei 15.3.1.2 prezintă încă 
un avantaj important: pe fiecare interval J, ={ GER|S,,.( =k}, k=1,2,...,n-1, pe 
lângă scorul k, care are probabilitatea maximă, au probabilitate diferită de zero 
doar scorurile k-l şi k+l. 
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to — ee 


TL, max 12,4 nin 


Figura 15.3.1.1 
Legătura dintre funcţia Spa $i funcţiile caracteristice ale itemilor 


15.3.2. Validitatea relativă la criteriu 
Validarea unui test relativă la un criteriu constă în compararea ierarhiei 


produse de scorurile testului cu o altă ierarhie, realizată de o variabilă criteriu. 
Adică, validarea relativă la criteriu constă în gh iulia te a două clasamente. 


Notăm: 

A= o mulţime formată din N persoane care au fost examinate cu testul a 
cărui validitate se os si pentru care se cunosc valorile variabilei 
criteriu; 

T= mulţimea scorurilor de test obţinute de persoanele din mulţimea A: 

T = {t)5 Poseta) GER pentru î=1,2,...,n Şi tystas... Stn 
C= mulțimea valorilor criteriului pentru persoanele din mulţimea A; 


C= (Cp, Cz. Cm) cER pentru j=1,2,...„m ŞI C)<C7<...<Cpy 
(a) = scorul la test al unei persoane aCA; 
c(a) = valoarea criteriului pentru persoana a€A; 

Definim în mulţimea A următoarele relaţii: 
pentru orice a,beA: 
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a>,b <=> t(a)>t(b) 
a=b <=> t(a)=t(b) 
azb <=> a> qb sau a=rb 


a>cb <=> c(a)>c(b) 
a=cb <=> c(a)=c(b) 
azcb <=> a> b sau a= b 


Relaţiile > şi 2c sunt preordini totale î în A. 
Considerăm că un test măsoară acelaşi lucru ca şi criteriul, adică este 
valid relativ la criteriu, dacă îndeplineşte următoarele două condiţii: 


(D1) două persoane care au rezultate egale la criteriu obţin rezultate egale şi 
la test: | 
a=cb => a=b a,beA 


(D2) dacă o persoană îi este superioară alteia la criteriu, atunci îi este 
„Superioară şi la test: _ 

a>cb => a> b a,beA. 

Cele doua conditii i eee ca in n mulfimea A clasamentele 21 Şi >c să fie 
identice: 

azb <=> azcb, a,beA. 

Dar acest lucru înseamnă că numărul claselor de echivalență în raport 
cu relaţiile =, şi = =ç este acelaşi. Fiecare clasă de echivalență pentru relaţia = 
corespunde unei valori de test, iar fiecare clasă de echivalență pentru relaţia =c 
corespunde unei valori a criteriului. Or, în multe situaţii intilnite în practică, 
„numărul valorilor posibile ale testului diferă de numărul valorilor posibile ale 
criteriului, ceea ce face ca să nu poată fi îndeplinite condiţiile (D1) şi (D2). Din - 
acest motiv, am înlocuit aceste condiţii ci cu următoarele: 
e dacă n<m atunci: 
| (D1.1) a=cb => a=b 

(D2.1) a>cb => azb 
e dacă n>m, atunci: | 
| (D1.2) a= sb => a=cb 
-(D2.2) a> xb => azcb 
e daca n=m, atunci: 
(D1.3) a=cb => a=rb 

(D2.3) a>cb => a>qb ` 

Aceste conditii se pot transcrie astfel: 
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e dacă n<m, atunci partitia ordonată corespunzătoare relaţiei >ç este o rafinare 
a partiției ordonate corespunzătoare relaţiei 27; 
e dacă n>m, atunci partitia ordonată corespunzătoare relaţiei 2+ este o rafinare 
__ a partiției ordonate corespunzătoare relaţiei >ç; 

e dacă n=m, atunci relaţiile 27 şi >ç sunt identice. 
Ele conduc la următoarea definiţie: 


DEFINIŢIA 15.3.2.1. Un test este valid relativ la un criteriu pentru mulţimea 
de persoane A daca partifiile ordonate corespunzatoare relatiilor de preordine 
>q şi >ç coincid sau una este o rafinare a celeilalte. 


Se observă că atunci când coeficientul de validitate se exprimă prin 
coeficientul de corelaţie a rangurilor al lui Spearman, el ia valoarea 1 dacă şi 
numai dacă cele două clasamente, 2c şi 27, coincid. Dacă, însă, coefi cientul de 
validitate este dat de coeficientul de corelaţie liniară între test şi criteriu, atunci 
sunt adevăr ate următoarele afirmaţii: 

e obţinerea valorii 1 a coeficientului de (aliditate înseamnă că sunt 
verificate condiţiile din definiţia 15.3.2.1; 

` @ nu întotdeauna când sunt satisfăcute condiţiile definiţiei 15.3.2.1 
coeficientul de validitate ia valoarea 1. 

Deci coeficientul de corelaţie liniară nu ne permite să deducem dacă un 
test este valid relativ la criteriu în sensul definiţiei 15.3.2.1. 

În continuare propunem o metodă de ânaliză a relaţiei test-criteriu, utilă 
pentru aprecierea validității relative la criteriu a unui test atunci et mulţimea 
A conţine un număr mare de persoane. 

Pe baza valorilor variabilei criteriu şi a valorilor obținute la test de către 
subiecţii din mulţimea A se alcătuieşte următorul tabel de frecvenţe: 


Criteriu 
ui Ciu € 


Fat Sig Fim 


un Sy “Fim 
Lat 


unde f,; = numărul Ps: “sai care au valoarea ç la criteriu şi scorul 4 la test, 
IND e m T ze 
Din felul îi în care au fost defi nite multimile C si T rezulta: 
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n 


yy, =N 


i=] j=l. 


n b 


IA > 0, j=1,2,...,m 


i=] 


A | | 
Data, încă 3142 
ji i 


Pentru fiecare pereche de valori de test IE T, i<j, se calculează 
probabilitatea ca un subiect care a obţinut rezultatul t; să fie inferior, în privinţa 
variabilei criteriu, unei persoane care a realizat la test valoarea 4; | 


P= P(a>cb | (BL, şi (a)=4,) | (15.3.2.1) 
me KEL ag i 
2 hal EL 
ici: plaga a (15.3.2.2) 
9 A) (3 com | 


Se defineste Webi wtp ls Da au, 
„Pentru fiecare valoare de test LET se calculează probabilitatea ca doi 


subiecţi care au obţinut scorul t; să aibă valori egale la variabila criteriu: 


Pui > P(a=cb | t(a)=t, si (B)=4,) ab (15:3 2:3) 
m p = 
tix!) 
a daca DD Í Pl 
< k=l 
Pi SIE SDO Sa) (15.3.2.4) 
k=l k=l 
m , 
TA > dacă Fi i 
k=] 
Se obține astfel o matrice simetrică BERN jum: 
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Probabilitatile P,; care se abat cel mai mult de la valoarea 1 corespund: 
perechilor de valori de test care nu pot fi interpretate corect. Atunci când i<j și. 
P<0.5, este foarte riscant sa se afirme despre un subiect care a obţinut la y 
rezultatul e t; că este superior unei persoane care a realizat valoarea 4; 

Definim doi coeficienti de validitate relativa la criteriu, prin nw ate 
formule (Albu, Pitariu, 1994): | | 

Vag = min{P, | iy=1,2,.... şi iti ; @15.3.2.5)) | 

Vg > Min {P, |i=1,2,...:7} (15.3.2.6) 
Aceştia se interpretează astfel : 

e Există o probabilitate de cel putin 100% ca un subiect a care ! p 
obținut la test un rezultat mai bun decât un alt subiect b (a>7b), să fie mai bun 
decât acesta şi în privința variabilei criteriu (a>çb). 

e Există o probabilitate de cel putin 100V,,% ca doi subiecţi, a şi b, 
care au realizat aceeaşi valoare la test (a=b) să fie egali şi la variabila criteriu 


(a=cb). 


Legătura dintre validitatea relativă la criteriu a testului şi coeficienţii V, 
şi Va poate fi formulată astfel: 


eg 


TEOREMA 15.3.2.1 

a. Cand m=n atunci testul este valid dacă si numai dacă V= Val. 
b. Dacă m<n şi testul este valid atunci >. 

c. Dacă m>n şi testul este valid atunci V4 Fl. 


Se poate îmbunătăţi valoarea coeficientului Vz, pentru un test ţinând 
cont de următoarea observaţie; Dacă se înlocuiesc două valori de test 
consecutive, t; şi t} cu o valoare nouă, f,,;,;, atunci fiecare probabilitate Pisi uk 
va fi cuprinsă în intervalul 

„Amin {PrP i3 MAX {PP ir rah), 
k=1,2,...,” 


Deci se poate mări valoarea coeficientului V4, prin reunirea a două sau 
mai multe valori de test consecutive. 

Înlocuind valorile t, £.),... fu» k>1, din T cu o valoare noya, t 
cardinalul mulţimii T, n, scade. Coeficientul Vz, creşte, dar este posibil ca 
valoarea coeficientului V. să scadă. 


Exemplu. 
i S-a aplicat acest procedeu pentru o scală nouă, A, alcătuită din itemi 
extraşi din Inventarul Psihologic California (CPI). Drept variabilă criteriu s-a 
folosit o scală existentă în CPI, scala Dominanta (Do). 


299 


In figura 15.3.2.1 sunt reprezentate sub forma unei dendrograme gruparile 
de scoruri realizate de algoritm. — | | 
În tabelul 15.3.2.1 sunt notate, pentru fiecare pas, valorile coeficienţilor 
Varsi Vg. Se constată că, în timp ce coeficientul Va creşte de la 0.442, deci de 
la o valoare necorespunzătoare pentru test, la 0.793, coeficientul Vg oscilează. 
Se impune o observaţie: Coeficientul de corelaţie dintre scalele A şi Do este 
egal cu 0.856, pentru N=1065. În conformitate cu procedeul obişnuit de lucru, 
s-ar deduce că scala A are o validitate bună relativ la scala Do. Or, 
probabilitatea de a interpreta corect rezultatele obţinute de doi subiecţi este, 
pentru unele perechi de scoruri, mai mică decât 50%. ~ 


Tabelul 15.3.2.1 
Valorile coeficienţilor de validitate 
la fiecare pas al algoritmului 


Grupele de scoruri formate | 


14,15 
23 
9,10 
6,7 
12,13 
4,5 
8,(9,10) 
(12,13),(14,15) 
0,1 
(4,5),(6,7) 
(0,1),(2,3) 
(8,(9,10)),11 
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Scoruri finale pentru scala A 


0 1 2 4814156 718 "910 11 12/983 14 15 16 


Scoruri iniţiale pentru scala A 


Figura 15.3.2.1 
Gruparea scorurilor pentru scala A 
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ANEXA I ‘ 
NOTIUNI DE TEORIA CLASIFICARII 


I.1. RELAȚII CARE INTERVIN ÎN CLASIF ICARE 


Fie Ao multime finită s si R o relație binară definită pe A. Pentr ua,beA 
notăm non(aRb) dacă nu are loc aRb. 


DEFINIŢIA 1.1.1. 

_ Reste reflexivă <=> VaeA: aRa 
(orice element este în relaţia R cu el insusi); 

R este simetrică <=> Va,beA: aRb => bRa 
(daca un element a este in relatia R cu un element b, atunci si elementul 
b este în relaţia R cu a); 

R este antisimetrică <=> Va,beA, a+b: aRb => non(bRa) 
(daca un element a este in relatia R cu un element b distinct de a, atunci 
elementul b nu este în relaţia R cu a); 

R este tranzitivă <=> Va,b,ceA: aRb şi bRe => aRc; 
(pentru oricare trei elemente, a, b şi c dacă a este în relaţia R cu b, iar 
b este în relaţia R cu c, atunci a este în relaţia R şi cu c); 

R este completă <=> Va,beA => aRb sau bRa. 
(pentru orice pereche de elemente, a şi b, distincte sau nu între ele, are 
loc cel puţin una dintre următoarele două afirmaţii: "a este în relaţia R 
cub” şi "b este în fp R cua). 


Exemplul I.1.1. 

Considerăm mulțimea A formată ai elevii unei clase care au fost 
examinati cu un test psihologic. Pentru fiecare elev, aeA, notăm cu s(a) scorul 
obținut la test. 

În mulțimea A definim trei relații binare, S, E şi C, astfel: 
pentru oricare două elemente a,beA: 

aSb <=> s(a)>s(b) 

(a este în relaţia S cu b dacă a este "superior" lui b la test, adică 
a a obţinut un scor mai mare decât b); 

aEb <=> s(a)=s(b) 

(a este în relaţia E cu b dacă a este "egal" cu b la test, adică a 
şi b au obţinut acelaşi scor); 

aCb <=> s(a)>s(b) 
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(a este în relaţia C cu b dacă a este "cel putin la fel de bun ca 
şi b la test, adică a a obţinut un scor egal cu cel al lui b sau mai 
mare decât acesta). 
Aceste relaţii au următoarele ordinii: 
e Pentru orice element a din A, are loc s(a)=s(a), adică aKa. Prin urmare, 
relaţia E este reflexivă. 
e Analog se arată că relaţia C este reflexivă. | 
e Relaţia S nu este reflexivă, pentru că nici un elev nu a obţinut scor mai mare 
decât scorul propriu: nu are loc s(a)>s(a), pentru nici un element a din A. 
e Pentru oricare două elemente din A, a şi b, dacă scorul lui a este egal cu 
scorul lui b atunci şi scorul lui b este egal cu cel al lui a, deci, din aEb rezultă 
bEa. Prin urmare, relaţia E este simetrică. 
e Dacă scorul unui element a este mai mare decât scorul unui element b, atunci 
scorul lui b nu poate fi mai mare decât scorul lui a. Deci, din aSb rezultă 
non(bSa). Prin urmare, relaţia S este antisimetrica. 
e Dacă între scorurile a doi elevi, a şi b, există inegalitatea s(a)>s(b), nu se 
poate şti dacă are loc şi inegalitatea s(b)>s(a) (care ar fi adevărată daca 
s(a)=s(b)) sau are loc non(s(b)>s(a)) (ceea ce ar fi adevărat dacă s(a)>s(b)). Prin 
urmare, relaţia C nu este nici simetrică, nici antisimetrică. 
e Dacă un element a din A are un scor egal cu cel al unui element b, care este 
egal cu cel al unui element c, atunci scorul lui a este egal cu cel al lui c. Adică, 
din aEb şi bEc rezultă aEc. Prin urmare, relaţia Æ este tranzitivă. 
e Analog se arată că relaţiile S şi C sunt tranzitive. — 
e Pentru oricare două elemente din A, a şi b, este adevărată una din relaţiile 
s(a)>s(b), s(a)>s(b), s(b)>s(a). Înseamnă că are loc cel putin una dintre 
inegalitatile s(a)2s(b) şi s(b)s(a), respectiv este adevărată cel putin una dintre 
afirmaţiile "aCb" şi "bCa". Adică relaţia C este completa. 
e Relaţiile S si Æ nu sunt complete. 


DEFINIŢIA 1.1.2. O relaţie reflexiva, tranzitivă şi simetrică se numeşte relaţie 
de echivalență. 

Dacă R este o relaţie de echivalență şi pentru două elemente a,beA are 
loc aRb, se spune că "a şi b sunt echivalente”. Fiind dată o relaţie de echivalență 
pe mulţimea A, orice submulțime a lui A formată din elemente echivalente între 
ele formează o clasă de echivalență. 


Exemplul 1.1.2. 

Relaţia Æ din exemplul [.1.1. este o relaţie de echivalență. 

O clasă de echivalență este formată'din toţi elevii care au obţinut acelaşi 
scor la test. 
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DEFINIŢIA 1.1.3.0 relaţie tranzitivă şi completă se numeşte preordine totală. 


Exemplul 1.1.3. 
l Relatia C este o preordine totală. 


Dacă R este o preordine totală şi pentru două elemente a şi b din 
mulțimea A are loc aRb vom spune că "a este preferat lui b". 


DEFINIȚIA 1.1.4. O T: totală antisimetrică se numeşte ordine totală 


Exemplul 1.1.4. 
Dacă în mulţimea A nu există elevi care să fi objinut gelas scor, atunci 
relația S este o ordine totală. | 


TEOREMA 1.1.1. Dacă R este o relaţie de ordie totală pe A, atunci relația 
I, definită pe A astfel: — 

pentru orice a,beA, alb <=> aRb şi bRa ; (1.1.1) 
este o relaţie de echivalență. | | 


Exemplul 1.1.5. 

Utilizând relaţiile definite în exemplul 1.1.1 se constată că relaţia / 
definită prin formula (1.1.1) cu ajutorul relaţiei C 

„alb <=> aCb şi bCa 
coincide cu relaţia E: 

pentru orice a,beA, alb <=> s(a)>s(b) şi s(b)2 s(a) <=> S(a)=s(b) <=> 
aEb 


1.2. PARTIŢII 
Fie E o mulţime finită cu n elemente. 


DEFINIŢIA 1.2.1. O partiție a mulţimii E, P(E), este o mulţime de părţi ale lui 
E: 
P(E) = {E,, E,,...,E,}, Ejs E, i=1,2,...,4 
două câte două disjuncte: 
ENE FØ pentru orice iz) (1.2.1) 
şi a căror reuniune este egală cu E: 
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E, UE, U...UE,=E Aia) 
Aceste parti se numesc clasele partiției. 


Indicarea unei partitii pe o mulţime E este acelaşi lucru cu indicarea 
unei relaţii de echivalență pe E: două elemente x,yveE sunt echivalente dacă şi 
numai dacă x şi y aparţin aceleiaşi clase a partiției. 

Dacă pe mulţimea E a fost definită o relaţie de preordine totală R, atunci 
relaţia de echivalență / definită prin formula (1.1.1) determină o partiție a 
mulţimii E. Clasele partiției au proprietatea că ele pot fi aşezate în ordine, astfel 
încât, pentru orice clasă aleasă, E;, fiecare element al ei, aeE,, este în relaţiile 

aRb şi non(bRa) (1.2.3) 
cu fiecare element b al oricărei clase E, aflate in dreapta clasei E;. 


Exemplul 1.2.1. 

Să reluăm exemplul 1.1.1 şi să notăm cu s$}, s,,...,5, scorurile care au fost 
obţinute de elevii mulţimii A, aşezate în ordine descrescătoare: s)>5)>...>5;,. 

Notăm cu A; mulţimea elevilor din A care au obţinut scorul s; 
i=],2,...,k. 

Multimile Ai A,,...,A, formează O partiție a mulţimii A. Orice element 
a al unei clase A, este în relaţia aCb şi non(bCa), adică s(a)>s(b), cu orice 
element b al claselor Aus Apn Ap pentru i=1,2,...,k-1. 


DEFINIŢIA 1.2.2. Un vector cu componente mulţimi, (E, Ez, ..., Ep) ESE, 
i=1,2,...,k, este o partiție ordonată pe mulţimea E, corespunzătoare relaţiei de 
preordine totală R dacă îndeplineşte următoarele condiţii: 

e pentru orice mulţime E; i=1,2,...,4, şi oricare două elemente a,bek au loc 
relaţiile aRb şi bRa; ` 

e pentru oricare două mulţimi, E; şi E; cu i<j, şi oricare două elemente acE, şi 
beE;, au loc relaţiile aRb şi non(bRa). 


Oricărei relaţii de preordine totală pe mulţimea E, R, îi corespunde o 
singură partiție ordonată pe E. 


Fie 
(A, Az- Am) (1.2.4) 
$i 
(B,, Bz... Z Bp) (I. 2. 5) 
două partitii ordonate pe mulţimea E, corespunzătoare la două relaţii de 
preordine totală, R, şi R}. 
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DEFINITIA 1.2.3. Se spune ca partitiile ordonate (1.2.4) şi (1.2.5) coincid dacă 
m=p şi pentru orice i=1,2,.. „m are loc A;=B,. 


DEFINITIA 1.2.4. Se spune că partitia ordonată (1.2.4) este o rafinare a 
partiției ordonate (1.2.5) dacă m>p si orice clasă de echivalență Aj, i=1,2,...,m, 
este o submultime a unei clase de echivalență B; Jet Za): ACB, 


I.3. NUMEROTARE A UNEI PREORDINI TOTALE 


Fie E o mulţime finită cu n elemente şi R o relaţie de preordine totală 
pe E. | 


DEFINIŢIA 1.3.1. Se numeşte numerotare a elementelor lui E o funcţie . 
bijectivă fi E -> {1,2,.. sn). 


Prin urmare, numerotarea constă în atribuirea de numere consecutive 
elementelor din. E, începând cu 1, astfel încât oricare două elemente să 
primească numere diferite. 

Convenim să notăm cu e; elementul din E pentru care pt) et ale ee A 


DEFINITIA 1.3.2. O numerotare a mulţimii E, JMO eet heb Th este o 
numerotare a preordinii totale R dacă pentru oricare două elemente distincte 
a,beE are loc implicatia: 

Ka)<f(b) => aRb | (1.3.1) 


“Aceasta înseamnă că sunt adevărate relaţiile e;Re, pentru orice 
I=1,2,...52°1 şi fit] Eh. 
Observaţie. Din faptul că pentru două elemente distincte a,beE are loc aRb nu 
se deduce Kase), intrucat este posibil ca impreună cu relaţia aRb să fie 
adevărată şi relaţia bRa. 


TEOREMA 1.3.1. Pentru orice relaţie de preordine totală R există cel puţin o 
numerotare a preordinii. 


Demonstrația acestei teoreme este constructivă, indicând metoda de 


definire a funcţiei f. Se procedează conform algoritmului următor: 
(1) Se formează partiţia ordonată corespunzătoare relaţiei R pe mulţimea E: 
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(Ep Ez. E) 
(2) Pentru fiecare clasă a partiției, E;, 1=1,2,...,m, se notează cu n; numărul de 
elemente componente. Evident, nytnyt... +n, mn. 
(3) Se defineşte o funcție bijectivă £: E -> {1,2,...,n} astfel: 
VeeE,: fe)e(1,2,....n]) i 
VeeE,, feje{ntl,nit2,.. ntn} 


Veek,,, fleje{nytnzt...tn,, +1 OAN e th 2s a -T 
Observație. 

Cu excepția cazului când fiecare clasă a partiției conține un singur 
element, pentru preordinea totală R pot fi definite mai multe numerotari. Dar, 
orice numerotare f are proprietatea că media valorilor sale pe o clasă E, este 
egală cu: 

mal 


ME) = hit y (1.3.2) 


i=1,2,...,m, cu convenția ng=0. 


DEFINIŢIA 1.3.3. Funcţia r: E -> R definită prin: 

VeeE; r(e)=m(E,), 1=1,2;.,m (1.3.3) 
se numeşte funcție rang. Valoarea ei pentru un element e€E se numeşte rangul 
elementului e în preordinea totală R. 

Toate elementele din E care aparţin aceleiaşi clase de echivalență au 
acelaşi rang. Numărul valorilor distincte ale funcţiei rang este egal cu numărul 
claselor de echivalență ale partiției ordonate determinată de relaţia de preordine 
R. : 


Exemplul 1.3.1. 


Fie E=(e,, €» ex €p €s egez 0 mulţime de elevi care au fost examinati 
cu un test de atenţie. In următorul tabel este notat numărul greşelilor făcute de 


fiecare elev: 
geo mk elan ii rac 
Come ee ae 


Nr. erori 
Pe mulţimea E se defineşte o relaţie R, astfel: 
eRe; <=> e, a făcut mai puţine erori sau tot atâtea ca şi e, i=1,2,...,7. 
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Relaţia R este o relaţie de preordine totală pe mulţimea elevilor. Partitia 
ordonată corespunzătoare ei este: 
({es}, {23}, tepe), teze), {€6}). 
Valorile funcţiei rang r:E -> R se caloulează astfel: 
r(e; = 0 + (1+1)/2=1 
r(e; = 1 + (1+1)/2 =2 
r(e) = r(e,) = 2 + (2+1)/2 = 3.5 
r(e3) = r(e7) = 4 + (2+1)/2 = 5.5 
r(e; = 6 + (1+1)P2 =7 


1.4. CLASAMENTE 


Fie E o mulţime finită cu n elemente, R o relaţie de preordine totală pe: 
E şi r funcţia rang asociată relaţiei R. 


DEFINIŢIA 1.4.1. Se numeşte clasament sau ierarhie pe mulţimea E 
ordonarea elementelor mulţimii E stabilită de funcţia rang r, în care locul 
fiecărui element este egal cu rangul său. 

Deci, un clasament este totdeauna asociat unei relaţii de preordine 
totală. . 


Exemplul 1.4.1. Pentru elevii mulţimii E din exemplul 1.3.1 clasamentul este 
următorul: 


Elev Loc 
. ê; l 

e; 2 

e) 3.5 
e, 3.5 
ez. Sa) 4 
er '.5 
eg 7 


„Să considerăm două relaţii de preordine totală pe mulțimea E, R; şi R | 
şi funcţiile rang asociate acestora, r, şi rp. 

Pentru fiecare element ecE notăm cu r,(e) locul ocupat în primul 
clasament şi cu r,(e) locul ocupat în al doilea clasament., r (e) ŞI (e) sunt 
rangurile elementului e în cele două preordini totale. 


308 


DEFINIŢIA 1.4.2. Clasamentele asociate relaţiilor de preordine totală R, gi R3 
coincid dacă pentru orice element eeE are loc egalitatea 1,(e)=r,(e). 


TEOREMA 1.4.1. Clasamentele asociate relaţiilor de preordine totală R, si R, 
coincid dacă şi numai dacă relaţiile R, şi R, sunt identice. 


DEFINIŢIA 1.4.3. Clasamentul asociat relaţiei de preordine totală R, este o 
rafinare a clasamentului asociat relaţiei de preordine totală R, dacă sunt 
îndeplinite următoarele condiţii: | 

e pentru oricare două elemente a,beE are loc r(a)<r,(b) numai dacă 
rfa)sr(b); | 

e pentru oricare două elemente a,beE din egalitatea r,(a)=r,(b) rezultă 


rfa)=r{0). 


Se constată că un clasamentul care este o rafinare a altui clasament are 
mai multe locuri distincte decât acesta. | 


TEOREMA 1.4.2. Clasamentul asociat relaţiei de preordine totală R, este o 
rafinare a clasamentului asociat relaţiei de preordine totală R, dacă şi numai 
dacă partitia ordonată corespunzătore relaţiei R, este o rafinare a partiției 
ordonate corespunzătoare relaţiei R;. pt | 


Exemplul 1.4.2. 


“Să reluăm exemplul 1.3.1 şi să presupunem că la o altă administrare a 
testului numărul erorilor comise de elevi este cel prezentat în tabelul următor: 


Elev ade 


A i 


Relaţia de preordine totală R, pe mulţimea elevilor fiind definită la fel 
ca în exemplul 1.3.1, partitia ordonată corespunzătoare ei este: 


({e5}, {e3}, {e} sfer, {ez}, (e-), (e) ). 


În acest caz, clasamentul elevilor este următorul: 
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Elev... “L 
e; 1 
e; 2 
gps p3 
ey 4 
e, 5 
ez 6 

e; 7 

Acest Afla este o rafinare a clasamentului cartgpunziras relatiei 
de preordine totală R din exemplul 1.3.1. 


1.5. COMPARAREA A DOUĂ PARTIŢII 


Fie E o mulţime şi 
(A, Agia} 


{B,, Bp.. 1 Bn} 
două partipi ale mulțimii E. 


şi 


Pentru a vedea cât de asemănătoare sunt cele două partitii, se 
construieşte un tablou de frecvenţe de următoarea formă: 


fir- «Jiv Sib 


fii- “hy: LAS 


unde /,, reprezintă numărul de obiecte care apartin clasei A; din prima partitie 
şi clasei B; din cea de-a doua partiție, pentru i=1,2,...,n şi j=1,2,...,m. 
Cele două partitii concordă perfect dacă sunt identice, adică dacă ele 


contin acelaşi număr de clase (m=n) şi fiecare clasă dintr-o partiție este egală cu. 
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o clasă din cealaltă partiție. Aceasta înseamnă că în tabelul de frecvenţe de mai 
sus pe fiecare linie şi pe fiecare coloană există câte o singură frecvenţă nenulă. 
O posibilitate de a cerceta dacă cele două partitii au legătură între ele 


o oferă testul 7’. 
Se calculează valoarea variabilei 7’ cu ajutorul formulei: 
= yas (1.5.1) 
i=] j=l lij 


unde, pentru i=1,2,...,n şi J=1,2,...,m: 
f ij Sunt frecvențele observate, citite din tabel; 
t,, reprezintă frecvențele teoretice, calculate cu formula: 


ÎI, 
ip (1.5.2) 


„ Se compara valoarea 7’ astfel calculată cu valoarea X iw ined, Citită din 
tabelul legii 7” pentru pragul æ fixat şi (n-1)(n-1) grade de libertate. 

Dacă y> Aapan, „atunci se respinge ipoteza ca cele două partitii sunt 
independente probabilistic între ele şi se acceptă ipoteza că între ele există 
legătură. 

O altă metodă de comparare a partitiilor este cea propusă de Huberty 
(1984), aplicabilă în cazul când m=n şi fiecare clasă B; corespunde clasei A;, 
i=1,2,...,7. Procedeul său este util atunci când se considera că partitia (A, 
A,,....A,} este corectă şi se doreşte să se aprecieze calitatea celeilalte partiţii prin 
comparare cu aceasta. De exemplu, când se construieşte un test psihologic 
pentru determinarea tipului temperamental al subiecţilor, pentru a aprecia dacă 
testul funcţionează corect, se vor compara rezultatele furnizate de el cu cele date 
de un alt test care este apreciat ca fiind bun. 

Metoda propusă de Huberty se bazează pe comparârea frecvenţei 
relative a obiectelor plasate în aceeaşi clasă în ambele partiţii: 


(1.5.3) 
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numită "raportul succesului”, cu valoarea S care se consideră că s-ar obţine 
pentru acest raport dacă prima partiție este corectă, iar a doua ar fi realizată la 
întâmplare. 

Modul de calcul al valorii S depinde de ipotezele care se fac. 


A. Se presupune că PAM iee Jlf i71,2;.. „n, reflectă Ah relative reale, 
în populaţia din care provine aia de obiecte clasificate, ale situaţiilor 
cuprinse în clasele 4; i=1,2,.. 

În acest caz left ca un obiect luat la întâmplare din populaţie 
să aparţină clasei A; poate fi considerată egală cu f,/f, iar frecvența absolută a 
obiectelor din clasa A; care vor fi repartizate în clasa B; datorită hazardului va 
fi Ffilf., i=1,2,...,.n. Pentru întreaga mulţime de obiecte clasificate Îvc0Venga 
relativă a concordantelor datorate norocului va fi ` 


ymw) (1.5.4) 


Dacă RS<S, atunci se poate aprecia că asemănările celor două partitii 
sunt datorate întâmplării. | 

În caz contrar, se verifică ipoteza nulă (RS<S) aplicând un test statistic 
de comparare a unei frecvenţe relative (RS) cu o valoare dată (S). 


B. Dacă frecvențele relative f/f , i=1,2,...„n, diferă de cele întâlnite în realitate 
şi una dintre ele este mult mai mare decât celelalte, atunci se calculează valoarea 
S pornind de la observaţia că s-ar putea obţine un număr mare de concordante 
repartizand toate obiectele în clasa A; pentru care Ji ja are cea mai mare valoare. 
Deci se ia 

CEEE TTE T ~ (1.5.5) 


şi se compara frecvenţa relativă RS cu S procedând ca în cazul precedent. 
O altă metodă de comparare a două partitii, aplicabilă în aceleaşi 
condiţii ca şi metoda lui Huberty, utilizează coeficientul K al lui Cohen 


(Bakeman, Gottman, 1986): 


a (1.5.6) 
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care compară raportul succesului RS, dat de formula 1.5.3, cu valoarea 


iP (1.5.7) 


„ Acest coeficient ia valori între -1. şi +1, concordanța perfectă a celor 
două partitii fiind indicată de valoarea maxima, +1. 


`~ 


1.6. COMPARAREA A DOUA CLASAMENTE 


Compararea a doua clasamente se bazeaza pe compararea partitiilor 
ordonate corespunzătoare relaţiilor de preordine totală cărora le sunt asociate 
clasamentele. 

Fie E o mulţime cu n elemente, R, şi R} două relaţii de preordine totală 
pe E şi | | 
| (Ay, Az,- Ap) (1.6.1) 
ŞI | 

(B,, B,,...,.Ba) (1.6.2) 
partitiile ordonate corespunzatoare lor. 

Pentru a compara clasamentele asociate relaţiilor R, şi R, se compara 
partifiile ordonate (1.6.1) şi (1.6.2). 

În acest scop, se poate utiliza metoda lui Huberty şi coeficientul K al lui 
Cohen. | 

În plus, în lucrările de statistică sunt definiti mai mulţi coeficienţi care 
permit compararea a două partitii ordonate, şi care, având valori cuprinse între 
-1 şi 1 (sau între 0 şi 1) sunt uşor de interpretat. 

Pentru fiecare element eeE, notăm cu r,(e), respectiv cu r(e), rangul 
elementului e în cele două partiţii ordonate, (1.6.1) şi (1.6.2). 

Unul dintre coeficienţii care servesc la compararea a două clasamente, 
cunoscut sub numele de coeficientul de corelaţie a maguro al lui 
Spearman este definit prin formula: 


_X,+X,-D 


DIX Xs 


nE. |. 


unde: 
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D 2 (e) gi „(e)P (1.6.4) 


3 


atm ul §3(0)- 
Rw TE) (n; (e) ne) (1.6.5) 


ne) reprezintă numărul de elemente care au acelaşi rang ca şi e in partitia 
ordonată corespunzatoare relaţiei de preordine totală R; pentru i=1,2. 

Daca R, si B sunt relaţii de ordine totală, atunci fiecare clasă de 
echivalență din cele două partitii ordonate conţine un singur element, prin 
urmare n,(e)=n,(e)=1 pentru orice element eeE. Deci: 


(1.6.6) ` 


Coeficientul p ia valoarea maximă, egală cu 1, dacă şi numai dacă 
partitiile ordonate (1.6.1) şi (1.6.2) coincid. Dacă R, şi R, realizează clasamente 
"inverse" în sensul că r,(e)=n+1-r,(e) pentru orice element eeE, atunci p=-1. 

Atunci când fiecare dintre partitiile ordonate (1.6.1) şi (1.6.2) este 
asociată unei variabile măsurată pe scală de interval sau de raport, iar fiecare 
clasă de echivalență corespunde unei valori (măsuri) a acestei variabile, pentru 
compararea celor două partitii ordonate se poate utiliza coeficientul de corelaţie 
liniară. În acest scop se întocmeşte un tabel de fecale de următoarea formă: 


Fir. aia ip 


fire fy: Sim 


unde f; reprezintă numărul de obiecte care au valoarea x pentru variabila X 
(aparţin clasei A; din prima partiție) şi valoarea Yj la ‘apt Y (apartin clasei 
B, din cea de-a doua partiție), pentru i=1,2,...,p şi /=1,2,.. 
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Coeficientul de corelaţie liniară r între variabilele X si Y se calculează 
cu formula: 


=> > Why -Nm(X)m(y) 


eel : (1.6.7) 
No(X)o(¥) 


unde: | 
m(X) şi m(Y) sunt mediile variabilelor X şi Y: 


= i=l (1.6.8) 
m(X) N 


È, 


nn- | (1.6.9) 


o(X) şi o(Y) sunt abaterile standard ale variabilelor X şi Y: 


i mSS, (1.6.10) 


(1.6.11) 


Acest coeficient arată în ce măsură norul de puncte (%;,);), 1=1,2,...p si 
j=1,2,..,m se grupează în jurul unei drepte. i 
Când norul de puncte este format din puncte asezate de-a lungul unei 
drepte, coeficientul de corelație liniară are valoarea +1 (dacă dreapta are pantă 
pozitivă) sau -1 (dacă dreapta are pantă negativă). Cu cât acest nor este mai 
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imprastiat, cu atât valoarea coeficientului de corelaţie liniară este mai apropiată 
de 0. | | 

Cu ajutorul testului Student (2) se poate verifica dacă valoarea unui 
coeficient de corelaţie liniară este semnificativ diferită de 0. Pentru aceasta se 
calculează valoarea £, cu ajutorul formulei: 


N-2 
2 


t=r (1.6.12) 


l-r 


unde: 
N este volumul mulțimii E; 
r este valoarea calculată a coeficientului de corelație liniară. 


Din tabelul legii Student se citeşte valoarea ty. ,, corespunzătoare 
pragului de probabilitate a fixat şi la N-2 grade de libertate. Dacă ty.2 9 atunci 
se respinge ipoteza că valoarea coeficientului r este nesemnificativă statistic (nu 
diferă semnificativ de 0). 


1.7. AGREGAREA CLASAMENTELOR 


Prin agregarea mai multor clasamente într-unul singur se înţelege 
definirea unei ierarhii a elementelor unei mulţimi E plecând de la o mulţime 
dată de clasamente iniţiale. i | 
| Fie E o mulţime finită, m un număr natural, m>2, şi Sp mulţimea 
relaţiilor de preordine totală existente pe E. 

Notăm cu 

Se"= — SexSpx.uxSp 

„| demori | ‘ 
mulţimea m-uplurilor de preordini totale ale elementelor din E. 


DEFINIŢIA 1.7.1. Se numeşte procedeu de agregare o funcţie 
8:Sg ->SE. | i 


Adică, un procedeu de agregare a clasamentelor construieşte un 
clasament pe mulțimea E cu ajutorul a m clasamente pe E. 

Trebuie reținut că nu orice funcție care construieşte o relație binară 
completă R pe mulțimea E pornind de la m preordini totale pe E este un 
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procedeu de agregare, întrucât nu se asigură totdeauna tranzitivitatea relaţiei R. 
Un exemplu de acest fel îl constituie metoda deciziei majoritare (Arrow, 1963), 
care defineşte o relaţie R în mulţimea E utilizând m relaţii de preordine totală 
pe E, R „Rae Rm astfel: 


Va,beE: aRb <=>) l> 351 
aRb © bRa (1.7.1) 


i=l,m i=l,m 


Adică a este preferat lui b în clasamentul final (are loc relaţia aRb) daca 
numărul ierarhiilor în care a este preferat lui b nu este mai mic decât numărul 
ierarhiilor în care b este preferat lui a. 

Este binecunoscut următorul exemplu, construit de marchizul de 
Condorcet în 1785 (Păun, 1987). 

Se consideră trei candidaţi, a, b şi c şi 60 de alegători care propun, 
fiecare, câte o relaţie de ordine totală pe mulţimea {a,b,c} şi, deci, o ierarhie a 
elementelor acestei mulţimi în care nu pot să apară doi candidaţi pe acelaşi loc. 
Să presupunem că s-au obţinut următoarele ierarhii: 


Locul Frecvența 


de 23 de ori 
de 17 ori 
de 2 ori; 
de 8 ori; 
de 10 ori. 


O- OSG. a] 
erroc¢n 
Trava 


Să aplicăm metoda deciziei majoritare, folosind simbolul > pentru a 
arăta că un element se află înaintea altuia în ierarhie şi notând cu R relaţia binară 
construită: 


a>b de 33 de ori şi b>a de 27 de ori => aRb 
b>c de 42 de ori şi c>b de 18 ori => bhe 
a>c de 25 de ori şi c>a de 35 de ori => cRa 


Deci relaţia R nu este tranzitivă. 


Două procedee de agregare, definite pentru cazul când ierarhiile de 
pornire corespund unor relaţii de ordine totală sunt metoda lui Borda (Păun, 
1987) şi metoda lui Onicescu (1970). 


ata 


Metoda lui Borda acordă m, m-1,..., 2, 1 puncte locurilor 1,2,...,.m din 
ierarhiile de plecare, însumează punctele obţinute de fiecare element şi 
ordonează descrescător punctajele totale. | 

Metoda lui Onicescu este similară metodei anterioare, cu deosebirea că 
locurilor 1,2,...,2 le acordă un număr de puncte: 


pe oa al 
2 20" om-l 


I.8. OPERAŢIILE CLASIFICĂRII 


„Clasificarea este o operaţie logică care acţionează asupra unei mulțimi 
de obiecte (sau fiinţe sau fenomene), fie pentru a le grupa, formând clase, fie 
pentru a le repartiza în clase existente. | 

Gruparea obiectelor în clase, prin clasificare, se face astfel încât gradul 
de asemănare (de similaritate) să fie mare între membrii aceleiaşi clase şi mic 
între membrii unor clase diferite. | 

În foarte multe cazuri clasele sunt disjuncte două câte două, 
determinând o partiție a mulţimii obiectelor clasificate. 

Alteori, prin clasificare se defineşte o partiție ordonată şi o ierarhie. 
Această operaţie se numeşte ierarhizare. Clasele formate în acest caz sunt 
alcătuite din elemente echivalente între ele. salar i 

În timpul constituirii claselor se stabileşte şi o descriere a lor, sub forma 
prototipurilor. Un prototip este un obiect ideal al clasei (de exemplu, poate fi. 
centrul de greutate al obiectelor grupate în clasă) sau o mulțime de obiecte 
ideale care îndeplinesc o anumită condiţie (de exemplu, valorile caracteristicilor 
lor verifică o ecuație). Termenul de "obiect ideal" desemnează un element care 
nu este necesar să aparțină mulțimii obiectelor clasificate, dar,care este descris 
în acelaşi mod ca şi acestea, adică prin aceleaşi caracteristici. 

Operația de determinare a clasei în care este cel mai potrivit să fie 
repartizat un obiect care nu aparţine mulţimii de obiecte pe baza cărora s-au 
format clasele este denumită clasare sau identificare. Ea acţionează de obicei 
prin compararea obiectului cu prototipurile claselor şi alegerea clasei al cărei 
prototip seamănă cel mai mult cu obiectul în cauză. 
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ANEXA II 
CATEVA NOTIUNI MATEMATICE ŞI STATISTICE 
CARE INTERVIN ÎN TEORIA TESTELOR 
PSIHOLOGICE 


II.1 DEFINIŢIA VARIABILEI 


O variabilă este o clasă generală sau o categorie de obiecte, evenimen- 
te, proprietăţi sau situaţii. Câteva exemple de variabile sunt: performanţa la un 
test de atenţie, inteligenţa, sexul, intensitatea zgomotului. În cadrul categoriei 
se pot observa diverse moduri de existenţă sau de manifestare a variabilei. De 
exemplu, pentru variabila "situaţia şcolară la sfârşitul anului şcolar, pentru 
elevi" sunt posibile cazurile "promovat", "corigent" şi "repetent". Acestea se 
numesc niveluri sau valori ale variabilei. 

O variabilă care are numai două valori se numeşte variabilă dihoto- 
mică sau variabilă booleană sau variabilă binară. Aşa sunt, de exemplu, 
variabila "sex" şi variabila asociată unui item la care răspunsurile posibile sunt 
"da" şi "nu", | | 

Unele variabile, precum sexul sau culoarea ochilor, au valori calitative 
(exprimate prin cuvinte), altele, cum sunt vârsta şi înălţimea, au valori 
cantitative (exprimate prin numere). 

În cazul variabilelor cu valori numerice sunt posibile două situaţii: 

(1) Variabila poate lua numai anumite valori numerice. Între oricare 
două valori ale variabilei există doar un număr fixat de valori posibile. Mulțimea 
tuturor valorilor variabilei este finită sau numărabilă. În acest caz se spune că 
variabila este discretă. De exemplu, numărul de copii al unei familii sau 
numărul de persoane dintr-o instituţie sunt variabile discrete. 

(2) Variabila poate lua orice valoare numerică dintr-un interval finit sau 
infinit dat. Între oricare două valori ale variabilei există o infinitate de valori 
posibile. În acest caz se spune că variabila este continuă. 


I.2. VARIABILE DEPENDENTE, VARIABILE 
_ INDEPENDENTE 


Variabila dependentă este variabila ale cărei valori depind de o altă 
variabilă, numită variabilă independentă. La rândul ei, variabila independentă 
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poate să depindă de o altă variabilă, fiind, deci, variabilă dependentă. Relaţia de 
dependenţă se referă strict la două variabile. . 

Există două tipuri de variabile independente: 

a. variabilele manipulate sunt cele pe care MEEA A le 
controlează prin manipulare activă pentru ¢ a urmări schimbările măsurabile 
apărute la variabila dependentă; 

b. variabilele nemanipulate sunt v variabile de lasia, icare: în funcție de 
valorile lor se grupează unitățile statistice si apoi se verifică dacă între grupele ` 
„ formate există deosebiri în emule valorilor variabilei dependente. 

Exemple. 

1. În cercetările asupra învăţării, variabila independentă manipulati poate fi 
intervalul de timp în care este prezent un stimul, iar variabila dependentă este 
precizia cu care subiecţii recunosc stimulul. O altă variabilă independentă 
: manipulata poate fi complexitatea stimulului, iar variabila dependentă, timpul 
necesar. subiecţilor pentru recunoaşterea stimulului. 
2. Se doreşte să se verifice ipoteza că deprinderile de rezolvare a problemelor 
morale depind de apartenenţa religioasă. În acest scop se formează grupe de 
persoane, în funcţie de religie, cărora li se administrează acelaşi test referitor la 
probleme morale. Se compară apoi rezultatele între 'grupe. În acest caz 
apartenenţa religioasă este variabila independentă nemanipulată. 


Unii autori înţeleg prin variabilă independentă o variabilă care cauzează 
modificări ale variabilei dependente. Variabila dependentă este efect al 
variabilei independente. Dar, dacă nu se controlează prin manipulare variabila 
independentă, este dificil de tras concluzii asupra existenţei relaţiei cauză-efect 
între variabila independentă şi cea dependentă. 


II.3. SCALE DE MASURA 


Compararea a două persoane, X şi Y, conduce adesea la formularea unor 
întrebări de genul: Este X mai frumoasă decât Y? Cu cât este X mai înaltă decât 
Y? De câte ori este câştigul lui Y mai mare decât cel al lui X? 
Descrierea unui obiect X poate fi făcută mai sugestivă raportând 

calităţile sale la cele ale populaţiei de obiecte din care face parte. Aceasta 
generează întrebări precum: Obiectul X este cu mult mai scump decât celelalte? 
Obiectul X este mai greu sau mai uşor decât celelalte? ş.a.m.d. 

Formularea răspunsurilor la întrebări ca cele de mai sus este mult 
“simplificată dacă se dau valori numerice caracteristicilor analizate, astfel încât 
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compararea obiectelor în privinţa fiecărei caracteristici să se reducă la 
compararea unor numere. Se realizează, în acest fel, măsurarea ii sau 
a obiectelor. | 

Există mai multe definiţii ale măsurării. Majoritatea acestora sunt de 
forma următoare: "măsurarea constă în atribuirea de x lui y în conformitate cu 
z", În funcţie de autor: ; 


x reprezintă "numere", “valori”, "scoruri" sau "simboluri abstracte"; 

y este înlocuit cu "obiecte", "evenimente", "lucruri", "situații", ua 
pais Ade WP "observaţii", "atribute", "proprietăți" sau "raspun- 
suri"; 

Z primeşte semnificația de "regulă specifică" sau "regulă de reprezentare" 


(Michell, 1997). 

În cadrul acestei lucrări, prin măsurare a unei caracteristici la o mulțime 
de obiecte înțelegem atribuirea de numere obiectelor studiate, conform unei 
reguli bine precizate, prin care se urmăreşte ca anumite relații existente între 
obiecte, în privința caracteristicii respective, să existe si între numerele atribuite 
lor. Mai precis, dacă în mulțimea obiectelor este definită o anumită relație (de 
exemplu, o relație de ordine), atunci trebuie să existe o relație similară în 
mulțimea măsurilor elementelor, iar dacă două obiecte sunt în relația considerată 
atunci măsurile lor trebuie să fie în relația similară ei. De pildă, dacă din punctul 
de vedere al caracteristicii cercetate un obiect X este superior unui obiect Y, 
atunci măsura:obiectului X trebuie să fie mai mare decât măsura obiectului Y. 

| Înseamnă, deci, că măsurarea stabileşte un izomorfism între mulţimea 
obiectelor şi mulţimea măsurilor obiectelor. În asemenea condiţii se pot efectua 
diverse operaţii asupra măsurilor obiectelor, iar concluziile desprinse se extind 
asupra obiectelor. 

Din punct de vedere matematic, măsurarea este o funcţie care ataşează 
fiecărui element din mulţimea de obiecte (mulţimea de definiţie a funcţiei), 
conform unor anumite reguli, un număr şi numai unul (din mulţimea în care 
funcţia ia valori), numit "măsura elementului”. 

Fiecare sistem de reguli impus defineşte câte un tip de măsurare sau 
câte un tip de seală. În general sunt utilizate patru tipuri de scale de măsură. În 
ordinea crescătoare a preciziei lor, acestea sunt: 

e scala nominală; 

e scala ordinala; 

e scala de interval; 

e scala de raport. 


Regulile impuse pentru definirea unui tip de scală le includ, totdeauna, 
pe cele impuse pentru definirea scalelor aflate pe un nivel inferior. De exemplu, 
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daca s-a putut defini o scala de interval, atunci s-ar fi putut defini şi o scala 
ordinală sau una nominală. | : 

Trebuie reținute două idei: 

(1) Alegerea unui anumit nivel de măsurare pentru o mulțime de obiecte 
este dependentă de numărul gi tipul relațiilor existente între obiecte $i care 
prezintă interes pentru cercetător. Evident, aceste relații se referă la caracte- 
ristica analizată. 

(2) Prelucrările statistice care pot fi efectuate asupra măsurilor obiec- 
telor pentru a cunoaşte mai bine obiectele sunt dependente de tipul de scală 
„utilizat. Cu cât scala de măsură este mai precisă, cu atât prelucrările statistice 
permise sunt mai complexe şi conduc la concluzii mai numeroase. 


Notăm în continuare cu A mulţimea obiectelor (Sau a indivizilor sau a 
fenomenelor), cu B mulţimea de numere din care se dau valori măsurilor 
elementelor din A şi cu m:A->B funcţia care realizează măsurarea. Deci, pentru 
- orice obiect acA, m(a) reprezintă măsura sa. _ 


Măsurarea pe o scală nominală poate fi realizată ori de câte ori 
caracteristica studiată permite împărţirea elementelor mulţimii A în clase 
disjuncte două câte două, adică atunci când există o partiție a mulţimii A. În 
fiecare clasă sunt grupate toate obiectele care pot fi considerate echivalente în 
privinţa acestei caracteristici. | 

De pildă, variabilele referitoare la categoria socio-profesională sau la 
sexul persoanelor pot fi măsurate pe scală nominală. 

„Regula impusă la măsurarea nominală este ca toate elementele dintr-o 
aceeaşi clasă de echivalență să aibă aceeaşi măsură şi o valoare a măsurii să 
apară numai la elemente echivalente între ele. Adică: | 
RI. Două elemente, a,bEA, au măsuri egale (m(a)=m(b)) dacă şi numai dacă 
ele sunt echivalente (a=b). 

O posibilitate de definire a unei scale nominale constă în atribuirea de 
numere distincte claselor de obiecte. Toate obiectele unei clase vor avea aceeaşi 
măsură, egală cu numărul ataşat clasei. De exemplu, prin "numărarea" 
elementelor din A se realizează o măsurare nominală; în acest caz fiecare clasă 
este constituită dintr-un singur obiect. Numerele pe care le primesc jucătorii 
unei echipe de fotbal în cadrul unui joc sunt de asemeneă măsuri nominale. 

Măsura unui element este o "etichetă" atribuită elementului, care 
serveşte doar la denumirea, identificarea sau clasificarea acestuia. Ea este 
numerică, dar ar fi putut fi exprimată şi prin cuvinte. Din acest motiv nu are 
sens să se efectueze calcule aritmetice cu măsurile nominale. 
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Prin măsurare nominală se obţine o singură informatie asupra elemen- 
telor mulţimii A: două elemente care au aceeaşi măsură sunt echivalente între 
ele. Se pot schimba între ele numerele atribuite claselor fără ca informaţia pe 
care ne-o furnizează o măsurare nominală să se schimbe. 


Măsurarea pe o scală ordinală impune ca elementele mulţimii A să 
poată fi aranjate în ordine, dar cu permisiunea ca mai multe obiecte să ocupe 
acelaşi loc. De exemplu, muncitorii unei secţii pot fi ordonati ţinând cont de 
randamentul lor, de la cel mai eficient la cel mai putin eficient. 

Convenim să spunem că un element acA este "superior" unui element 
beA dacă în şirul ordonat format elementul a se află înaintea lui b. Notăm acest 
lucru prin a>b. Relaţia > în cazul unei caracteristici concrete se poate traduce 
prin "este mai mare decât" sau "este mai bun decât" sau "este preferat lui" etc. 

Dacă două elemente, a,beA, ocupă acelaşi loc în şirul ordonat, vom 
spune că a şi b sunt "echivalente" şi vom nota a=b. Relaţia = poate însemna, în 
funcţie de context, "este la fel de mare ca" sau "este la fel de bun ca" sau "este 
apreciat la fel ca" etc. 

Prin urmare, măsurarea pe scală ordinală poate fi realizată dacă în 
mulţimea A există o relaţie de preordine totală, pe care o notăm cu 2. Oricare 
două elemente, a şi b din A, îndeplinesc una şi numai una dintre următoarele 
condiţii: 

a>b, dacă azb şi non(b2a); 

b>a, dacă bza şi non(azb); 

a=b, dacă azb şi bza. 

Măsurării ordinale i se impun regulile R1, de la scala nominală, si: 
R2. Pentru oricare două elemente a,beA aflate în relafia a>b măsura 
elementului a este mai mare decăt măsura elementului b: m(a)>m(b). 

Notăm cu (Aj, Ag, ..., Ay) partitia ordonată corespunzătoare preordinii 
totale >. Aici, pentru i=1,2,...,k, fiecare mulţime A; conţine elemente aflate între 
ele în relaţia = şi toate elementele din mulţimea A; sunt în relaţia > cu toate 
elementele mulțimilor Ass, Ajs2)---sAg 

Un algoritm simplu pentru definirea unei scale ordinale este următorul: 

(1) se aleg k numere, m,>m>...>m,; 

(2) tuturor elementelor din clasa A; li se atribuie numărul m; 

m(a)=m,, pentru orice jilir pa =1,2,...sh: 

Se realizează de asemenea o măsurare pe scala ordinala daca fiecărui 
element a din A i se ataşează numărul N-r(a)+1, unde N este volumul mulţimii 
A, iar r(a) este rangul elementului a în relaţia de preordine totală >. 
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Exemplu. ; 
Să presupunem că mulțimea A={a,b,c,d,e,f,g} este formată din membrii 
unei echipe de handbal, care au primit după un meci următoarele calificative: 


' QS SADAN | b : foarte bun; c : slab; 
d : foarte slab; e : mediocru; | J: slab; 
g : slab. 


Pe baza calificativelor, în mulțimea jucătorilor se poate defini o relație 
de preordine totală, căreia îi corespunde partitia ordonată ({b}, {e}, {a,c,fg}, 
{d}). Se determina rangul fiecărui jucător şi măsurile calculate cu ajutorul 

rangului: pala | 


Calificativ 
b 


foarte bun 
mediocru 
slab 
slab 
“slab 
slab 
foarte slab 


Măsurarea ordinală dă următoarele informaţii: 
e două elemente care au aceeaşi măsură sunt echivalente (nici una nu îi este 
superioară celeilalte); i 
e dintre două elemente cu măsuri neegale, cel care are măsura mai mare este 
superior celuilalt. i l 
Trebuie reținut că măsurarea ordinală nu spune nimic despre "distanța" 
existentă între două elemente ale mulțimii A. Dacă m(a)-m(b)=m(c)-m(d) nu 
înseamnă că a este tot cu atâta superior lui b cu cât c este superior lui d. 
Transformând măsurile obiectelor din mulţimea A printr-o funcţie 
crescătoare, se obţine o altă măsurare ordinală a elementelor din A, întrucât 
noile măsuri păstrează ordinea obiectelor. 


Măsurarea pe o scală de interval poate fi utilizată atunci când în 
mulţimea A există un clasament şi, în plus, se poate aprecia "distanţa" dintre . 
oricare două elemente în privinţa caracteristicii studiate. Această "distanţă" este 
o funcţie 

d: AXA ->R 
care atribuie fiecărei perechi de elemente din A, (a,b), un număr nenegativ, 
d(a,b)20, şi îndeplineşte următoarele trei condiţii: 
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C1. "Distanţa" dintre oricare două elemente echivalente este egală cu zero: a=b 
=> d(a,b)=0. 


-C2, Pentru oricare două elemente a,beA, "distanţa" dintre a şi b este egală cu 
"distanța" dintre b şi a: d(a,b)=d(b,a). 


C3. Pentru oricare trei elemente a,b,ceA, între care există relațiile (a>b sau a=b) 
şi (b>c sau b=c), are loc egalitatea: 
d(a,c) = d(a,b) + d(b,c) 


Unei scale de interval i se cere ca, pe lângă regulile R1 si R2 impuse 
scalei ordinale, să îndeplinească şi următoarea regulă: 

R3. Pentru oricare patru elemente a,b,c,eeA are loc 
Im(a)-m(b)| = |m(c)-m(e)| dacă şi numai dacă d(a,b)=d(c,e). 

Această regulă înseamnă că scala de interval atribuie unor obiecte egal 
distanţate între ele în privinţa caracteristicii cercetate, măsuri echidistante. 

Un exemplu de măsurare pe scală de interval îl constituie evaluarea 
inteligenţei unor personalităţi, realizată de C. Cox pe baza parcurgerii unui . 
material bibliografic vast. Au fost atribuite următoarele măsuri: 145 pentru 
Napoleon, 155 pentru Rembrandt, 165 pentru Beethoven şi 185 pentru Galileo 
Galilei. Prin aceşti coeficienţi de inteligenţă, Cox a vrut să afirme că "diferenţa 
dintre Rembrandt şi Napoleon este egală cu cea dintre Beethoven şi 
Rembrandt", iar "Galileo Galilei a fost mai inteligent decât Beethoven cu atâta 
cu cât Beethoven a fost mai inteligent decât Napoleon”. 

În cazul scalelor de interval, faptul că un element are măsura egală cu 
zero nu înseamnă că el este lipsit de caracteristica cercetată. 

Exemplul tipic de scală de interval se întâlneşte la măsurarea 
temperaturii. După cum se ştie, temperatura este un parametru ce caracterizează 
starea de încălzire a unui sistem fizic şi se determină pe baza variaţiei unor 
mărimi fizice (volum, rezistenţă electrică, forță electromotoare etc.), astfel încât 
unor variaţii egale ale mărimii fizice le corespund variaţii egale de temperatură. 
Termometrul cu care se înregistrează valorile temperaturii este gradat în unităţi 
echidistante. Indiferent ce reprezintă distanţa dintre două gradaţii succesive (un 
grad Celsius sau un grad Fahrenheit sau altceva) diferenţa de temperatură 
corespunzătoare distanţei dintre două gradatii succesive este la fel de mare, fie 
că este vorba despre gradatiile 2 şi 3 sau 10 şi 11. Se obişnuieşte să se atribuie 
unei temperaturi măsura zero, dar aceasta nu înseamnă absenţa totală a 
temperaturii. Zero grade Celsius corespunde, de exemplu, la 32 de grade 
Fahrenheit. Atât scala Celsius, cât şi scala Fahrenheit realizează măsurări de 
interval. | 


325 


Un alt exemplu de măsurare pe scală de interval îl reprezintă calen- 
darele. Unitatea de măsură pentru timp (an, lună, zi) este constantă în fiecare 
calendar. Dar, în calendarul evreiesc numărarea anilor se face începând cu 
"crearea lumii", a cărei dată este estimată prin secolul al IV-lea Î.C. Anului 1995 
îi corespunde în calendarul evreiesc anul 5755. 

Din aceste exemple se observă că măsurarea de tip interval fixează 
„arbitrar punctul zero (mărimea caracteristicii căreia să i se atribuie măsura zero) 
şi lungimea unităţii de măsură (“distanta" dintre două niveluri ale caracteristicii 
căreia să îi corespundă o diferență a măsurilor egală cu unu). 
ţi În cazul măsurării pe scală de interval, dacă măsurile obiectelor sunt 
transformate printr-o funcţie liniară: 

Mou) = p + qm(a), pentru orice element acA 
unde: 

p şi q sunt numere reale, g>0, 

m(a) este măsura elementului a în scala de interval considerată, 

M moula) este măsura nouă a elementului a 
se obţine de asemenea o măsurare de interval. 

„Această proprietate face posibilă compararea între ele a mai multor 
caracteristici ale unui obiect, măsurate pe scală de interval, chiar dacă fiecare 
dintre măsurători furnizează valori din alt interval. 

> 
Exemplu. 

Se administrează unei clase de elevi teste de cunoştinţe la gramatică, la 
matematică şi la biologie, fiecare test furnizând scoruri într-un alt interval. De 
pildă, la gramatică se pot obţine scoruri între 0 şi 20, la matematică între 0 şi 50, 
iar la biologie între 0 şi 100. Pentru a aprecia, la care dintre cele trei discipline 
este mai bun fiecare elev este necesar să se efectueze transformări prin care 
scorurile testelor să fie aduse într-un acelaşi interval de valori, de exemplu să fie 


cuprinse între -10 şi +10. 


Măsurarea pe o scală de raport poate fi realizată ori de câte ori sunt 
îndeplinite condiţiile pentru definirea unei scale de interval şi, în plus, se poate 
aprecia în mod obiectiv când un element este lipsit de caracteristica cercetată. 

De exemplu, se poate afirma cu siguranţă că un vehicul care stationeaza 
este lipsit de viteză. 

Scalei de raport i se impune ca, pe lângă regulile R1, R2 şi R3 să 
îndeplinească şi regula următoare: i 
R4. Un element acA are măsura egală cu zero dacă şi numai dacă el este lipsit 
de caracteristica cercetată. 
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Exemplu. 

A. Moles a realizat un clasament pentru 250 de compozitori cunoscuti, 
în ordinea frecvenţei cu care au fost interpretate creaţiile lor în concerte, într-un 
interval de timp fixat. S-a constatat astfel că lucrările lui Schubert au fost incluse 
în 3.6% din programele de concert, cele ale lui Johann Strauss în 1.2%, iar cele 
ale lui Gershwin, în 0.3%. Deci, compoziţiile lui Schubert sunt interpretate de 
3 ori mai frecvent decât cele ale lui Johann Strauss şi de 12 ori mai frecvent 
decât cele ale lui Gershwin. Variabila a cărei valoare pentru fiecare compozitor 
este frecvenţa cu care sunt interpretate creaţiile sale, exprimată în procente sau 
în număr de cazuri, este măsurată pe scală de raport. Ea are valoarea 0 doar dacă 
nici una dintre compoziţiile persoanei nu a fost inclusă în programele de 
concert. | i l 

Atunci când caracteristica măsurată reprezintă spațiu (lungime, 
suprafață, volum), masă sau timp trecut de la un eveniment fixat (de exemplu, 
durată de viață, timp de reacție) se poate stabili în mod obiectiv ce înseamnă 
"absența caracteristicii". Pentru asemenea variabile se pot defini măsurări de 
raport. 

Deosebirea dintre o măsurare de interval si una de raport constă in 
faptul că, la măsurarea de interval, din egalitatea m(a) = Km(b) nu se poate trage 
concluzia că a este "de K ori mai bun" decât b (în sensul relației >), dar acest 
lucru este posibil la măsurarea de raport. De pildă, indiferent-daca înălţimea 
persoanelor este măsurată în mm, m sau inch, un copil care are 160 cm este de 
două ori mai înalt decât unul care are 80 cm. Dacă o maşină se deplasează cu 60 
km/oră iar alta cu 30 km/oră, se poate spune că prima merge de două ori mai 
repede decât a doua. 

În cazul măsurării pe scală de raport, transformând măsurile obiectelor 
printr-o funcție liniară: 

Mou 2) = p + qm(a), pentru orice element acA 
cu p,geR şi q>0, dacă numărul p este diferit de zero nu se va mai obţine o 
măsurare pe scală de raport, ci doar o măsurare pe scală de interval. De această 
observaţie trebuie să se ţină seama atunci când se efectuează transformarea 
valorilor unei variabile în cote standard. | 

Gruparea valorilor unei variabile măsurate pe scală de interval sau de 
raport poate conduce la transformarea acesteia într-o variabilă măsurată pe scală 
ordinală. 


Exemplu. 


Variabila "vârstă", care are ca valoare, pentru fiecare persoană, numărul 
de ani impliniti, este măsurată pe scală de raport. Dacă se stabilesc trei grupe: 
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"sub 25 de ani", "între 25 şi 60 de ani" şi "peste 60 de ani", cărora li se atribuie 
valorile 1, 2 şi 3, atunci variabila va fi măsurată pe scală ordinală. 


Scala de interval şi cea de raport sunt denumite scale metrice. 
Variabilele ale căror valori se obţin printr-o măsurare pe scală de interval sau pe 
„ scala de raport se numesc variabile de tip scor. 

Alegerea unui tip de scală pentru măsurarea unei variabile trebuie să 
aibă în vedere, în primul rând, tipul de prelucrări statistice care ar trebui 
efectuate asupra variabilei. Dacă relaţiile cunoscute între elementele mulţimii 
A nu permit măsurarea variabilei pe scala care ar fi necesară calculelor statistice 
respective, se va realiza o măsurare pe o scală inferioară dar cât mai apropiată 
de aceasta. 

Atunci când "obiectele" care se măsoară sunt comportamente, apare o 
problemă suplimentară, cunoscută sub denumirea de "reactivitate". Se spune că 
o măsură este reactivă dacă operaţia de măsurare schimbă comportamentul 
subiecţilor (Cozby, 1993). Când persoanele se ştiu observate, comportamentul 
lor poate să difere de cel pe care l-ar avea în condiţii normale. Chiar şi 
parametrii fiziologici îşi pot schimba valorile din cauza prezenţei 
echipamentelor de înregistrare a lor. Din acest motiv, se recomandă ca înainte 
de a efectua măsurătorile să i se lase timp subiectului să se obişnuiască cu 
prezenţa observatorului sau a aparatului de măsură. 


11.4. DISTANȚE 


Fie E o mulţime de vectori din spaţiul euclidian M-dimensional (M22) 
şi x,veE două elemente oarecare: 

XEÈ(X pă2oe+XM4) 

Y= 12003): 

De exemplu, E poate corespunde unei mulţimi de persoane care au 
răspuns la M teste psihologice. Pentru fiecare persoană există în E un vector, 
care are ca şi componente scorurile realizate la teste, ordinea testelor fiind fixată 
(adică, cea de-a i-a componentă va conţine scorul la testul 1). 

Pentru calculul distanţei dintre x şi y se pot folosi următoarele norme ale 
spaţiului RM: 

e distanța Manhattan sau city block: 


M 
pian |x,-y, (11.4.1) 
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e distanţa euclidiană: 


M 
D,(xy)=, | > (x,-y,)? (11.4.2) 


e distanţa valorii maxime: 

Drax y Fmax {|x yj] : H1,2,...,4} (11.4.3) 
ə distanța Hamming, aplicabilă atunci când fiecare componentă a vectorilor are 
doar un număr finit de valori: distanța Hamming dintre vectorii x şi y este data 
de numărul componentelor în care cei doi vectori diferă. 
e distanța lui Mahalanobis: 

DMY E- Clay)? . (11.4.4) 

unde: | 
(x-y)' reprezintă transpusa vectorului coloană x-y; 
C=(0,),j-12,...M este matricea de covarianţă a celor M caracteristici pe mulţimea 


Atunci când componentele vectorilor din mulţimea E sunt valorile a M 
variabile şi aceste variabile sunt necorelate liniar două câte două pe mulţimea 
E, are loc o,=0 pentru î,/j=1,2,...,.M, i+j; deci matricea C! va fi o matrice 


pages 


Observaţii 

1. În cazul distanţei euclidierie şi a distanţei city block se poate obţine aceeaşi 
valoare a distanţei dintre doi vectori în două situaţii foarte deosebite: când diferă 
câte puţin valorile fiecărei componente şi când diferă mult valorile unei singure 
componente, celelalte fiind egale. Din acest motiv ele nu sunt potrivite să fie 
folosite atunci când o diferenţă mare între valorile unei singure componente 
(indiferent care) trebuie să conducă la concluzia că obiectele se deosebesc mult 
între ele. În asemenea situaţii este mai potrivită distanţa valorii maxime. 


Exemplu. 
Distanţele dintre vectorii: 
x=(0,0,0,0,0,0,0,0,0) 
y=(1,1,1,1,1,1,1,1,1) 
z=(3,0,0,0,0,0,0,0,0) 
v=(9,0,0,0,0,0,0,0,0) 

sunt: D,(x,y)=D\(x,v)=9, Dix,z)=3 
D (x,y)=D(x,z)=3 > Dx,v)=9 
Drak JFL, Dex EN Day? 


329: ~ 


2. Distanţa euclidiană, spre deosebire de distanţa city block, "amplifică" distan- 
tele dintre componente, făcând ca distanţele mari să pară şi mai mari (pentru că 
în formula de calcul a distanţei euclidiene diferenţele valorilor componentelor 
se ridică la pătrat). Adică, pentru distanţa euclidiană, o diferenţă mare între 
valorile unei componente contează mai mult decât diferenţele mici sau medii 
între valorile a două componente. 
“Exemplu 
Distanţele dintre vectorii 
x = (0,0,0,0,0) 
y=(1,1,1,1,0) 
z= (1,1,2,0,0) 
sunt: 
Dœ) = Dy(x,2)=4 
D x,y) = 2 D,(x,z) = 2.449 


3. Distanţa Hamming este potrivită atunci când nu are importanţă cât de mult 
„se deosebesc între ele valorile componentelor, ci numai dacă ele sunt diferite. 
Exemplu. 

Distanţele Hamming dintre vectorii: 

x=(0,0,0,0,0,0,0,0,0) 

slip Lu, 

z=(3,0,0,0,0,0,0,0,0) 

v=(9,0,0,0,0,0,0,0,0) 
sunt: 

Dy, Dsfx,2)=D;(x,v)=1 


4. Calculul distanţei lui Mahalanobis tine cont şi de felul în care valorile 
componentelor covariază (variază unele în raport cu altele), dar necesită 
cunoaşterea tuturor vectorilor din mulţimea E şi calculul covariantelor 
componentelor. ; 


II.5. COTE STANDARD, COTE STANDARDIZATE 


Fie X={x),x2,...,.X,} © mulţime de obiecte si V o variabilă care a fost 
măsurată, folosind o scală de interval sau de raport, la toate elementele mulţimii 
X. 

Notăm: 

m = media valorilor variabilei V pe mulțimea X: 


330 


> GDI (11.5.2) 


n 


Cota standard z corespunzatoare unei valori x, din X se calculeaza cu 
formula: i 


! | 
z= ra (11.5.3) 


Cota standard z; arată cu câte unităţi de abatere standard se distanțează 
valoarea x; de media valorilor variabilei V, m. 

Transformarea în cote standard nu modifică proportionalitatea interva- 
lelor scalei. Astfel, dacă,x, x;şi x, reprezintă trei valori ale variabilei V, iar z, z, 


sh Zi (1.5.4) 
XX Ze $ 


şi z, sunt cotele standard corespunzătoare, are loc egalitatea: 

care arată că distanțele relative între valorile variabilei V rămân aceleaşi. 
Inconvenientul utilizării cotelor z îl constituie faptul că acestea se 

exprimă prin numere cu semn gi cu zecimale, fiind cuprinse, în general, în 

intervalul [-3, +3]. O rezolvare practică o constituie efectuarea unei transformări 

liniare asupra cotelor z, care conduce la obținerea unor cote standardizate: 
z'= M+ Sz (05:5) 

unde: 


Zi = cota transformată a cotei standard z; 
MS = media şi abaterea standard pentru cotele standardizate obţinute prin 
transformare. 
În mod obişnuit, valorile z’ se Pe la numere întregi. 
În tabelul [1.5.1 sunt prezentate câteva dintre transformările utilizate mai 
` des (Lohse, Ludwig, Röhr, 1982). ` 


Tabelul I1.5.1 
Valorile M şi S pentru diverse transformări 
ale cotelor standard 


Cotele standardizate au aceleaşi PO ca si cotele standard z 
singura diferență între ele fiind valoarea mediei şi cea a abaterii standard. 
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